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我非常钦佩这部著作。在定性方法论领域，格尔茨和马奥尼是广受 
尊敬 的创新者。作芥精通各项论题，论点推群独步，论 ill: 清晰确凿，使 
本书受众广市。《两种传 承》 必将激起有益的 争论; 它对政治学方法论 
是一大贡献。 

—— 戴维. 瓦尔德内尔,弗吉尼亚大学 

杏朽文笔优美、令人倍服。这部杰作必将得到广泛阅读、学习和引用。 

——科林•埃尔曼，锡拉丘兹大学麦克斯韦学院 

这是社会研究 / y 法论的一部重要雛!它清楚地论 证丫定 量和定性 
研究的本质特征及其卷异,为我们理解社会研究的不同取向和传统提供 
了新的视 ft ， 值得社会研究荇认真阅读、深入思考。 

—— K 笑大，南京大学 

我赞同作皆的 结论: 定量研究和定性研究存在差别， fl | .地位同等歌 
要。:者的互补而非 K 相排斥,增进 f 我们对社会现象的刊!解。 

-张静，北京大学 



本书将社会科学中的定量和定性研究作为独立的传承 （ cuhures ) 
加以分析。我们是在过去十年的教学和研究过程中得出这“两种传承” 
观点的。我们不断地发现，定性与定量研究者在方法论导向和研究实 
践方面都采取了不同的方式。我们也发现，在这两类研究者之间存在 
着误解和勉强的交流。当我们尝试厘清这些事实时•逐渐清楚地 知道. 
定量研究和定性研究的传统展示出两种不同传承的全部特征，包括不 
同的规范、实践和工具箱。 

笔者撰写本书的目的 是：在 学术上促进理解这些传承在哪些方 
面存在差异以及差异背后的原理何在。为此，我们将广泛涉猎几乎 
全体社会科学家都要面对的方法论主题，涉及一些重要的研究设计 
和数据分析问题。本书讨论的许多主题在很多研究方法类教材中都 
没有提及，也不会在任何一本关于定量或定性方法论的实用类书籍 
中找到。由于任何社科学者在设计和开展研究时都要思考一系列问 
题，因而•在阅读和使用本书时，可以视之为一部指南，它为这些问题 
提供了指导。 

我们最初是在定性与多元方法研究所 （Institute for Qualitative 
and Multi-Method Research > 的教学过程中了解到了彼此的研究。近 
些年以来，很多学生入读该研究所，并为我们论证的两种传承提供了反 
馈，我们在此表示感谢。尤其要感谢研究所所长科林 • 埃尔曼 （Colin 
Elman ) 为我们的年度研究计划腾出空间。美国政治学会“定性与多元 
方法专业委员会 ’’（Organized Section on Qualitative and Multi-Method 
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Research of the American Political Science Association) 为本书中几个 

章节的初稿提供了时事通讯和会议报道，特此致谢。 

我们的第一版论证是一篇文章，发表在 2006 年《政治分析》 （ Po - 
litical Analysis ) 上。感谢《政治分析》的编辑罗伯特 • S . 埃里克森 
(Robert S . Erikson ) 对第一版的推进。我们如果不发表该文，可能就 
不会受到鼓励去继续发现和探究定量和定性研究的差异。 

我们在亚利桑那大学 （University of Arizona) 和西北大学 （ North¬ 
western University) 为研究生开设了方法论课程，在教学过程中讨论 
了本书手稿的部分内容。我们正是通过与许多采取定量和定性方法的 
研究生的互动，才将很多主题列在重要的方法论议题列表上。另外，本 
书的很多内容都在美国、欧洲和拉丁美洲的一些工作坊及短期课程中 
有过报告。很多研究生参加了这些讲习班、工作坊和短期课程并提出 
了洞见，在此表示感谢。我们还要特别感谢凯伦尼莎 • 莫罕达莉 
(Khairunnisa Mohamedali) 和克里斯托夫 • 纽伦 （Christoph Nguyen) 

完成了对附录中所报告文章的调查。感谢西北大学、威斯康星大学和 
耶鲁大学的师生们对本书的报告发表的评论。 

普林斯顿大学出版社的查克 • 迈尔斯 （Chuck Myers) 帮助我们获 
取审稿报告，使我们从中受益。查克的工作还推进了本书的出版过程。 
感谢格伦达 • 克鲁帕 （Glenda Krupa ) 润色手稿。第 13 章的卷首语最 
初出现在约翰 • 福克斯 （John Fox) 出版的《应用回归分析和广义线性 
模型》（第二版）中 {Applied Regression Analysis and Generalized 
Linear Models ) ( Los Angeles, CA ： Sage Publications ， 2008 )， 感谢世 
哲出版集团 (Sage Publications Inc.) 授权使用。 

最后，下面这些同仁都提供了富有洞见的评论 ：迈克 尔 • 鲍姆加特 
纳 （ Michael Baumgartner) ，纳撒尼尔 • 贝克 （Nathaniel Beck) ， 安德 
鲁 • 贝内特 （Andrew Bennett) ， 珍妮特 • 博克斯-斯蒂芬斯迈耶 （Janet 
Box-Steffensmeier) ，贝尔 • 布劳米勒 （Bear Braumoller) ，戴维 • 科利 
尔 （David Collier )， 撒德 • 唐宁 （Thard Dunning )， 科林 • 埃尔曼 （Colin 
Elman )， 约翰 • 耶林 （ John Gerring) ， 杰克 • 利维 （Jack Levy )， 戴安 






娜 • 卡皮斯泽韦斯基 （Diana Kapiszewski ) ， 查尔斯 • C •拉金 （Charles 
C . Ragin ) ， 卡斯滕 • 施奈德 （Carsten Schneider ) ， 贾森. 西赖特 （Jason 
Seawright ) ， 戴维 • 瓦尔德纳 （David Waldner ) 和塞巴斯蒂安 • 扎婭 
(Sebastian Zaja ) 。 我们深知同仁们不会都赞同本书中的每一个观点， 
但是我们希望，如果参与并讨论本书提出的观点，这本身就有助于推进 
社会科学中的定量和定性研究。 
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引论 


本书将探究社会科学领域中定性研究和定量研究传统之间的关系， 
特别关注政治科学和社会学。为此，我们将识別这些传统在哪些方面有 
别。这些对比出现在方法论的诸多领域•从研究问题的类型，到数据分 
析的模式，再到推断方法中皆有对比。我们认为，这些差异是系统、连贯 
且彼此相关的，因此 ，论及 不同的定量和定性研究范式是有意义的。 

我们把定量和定性研究传统看做可供选杼的传承。每一种研究传 
统都有自己的价值、信仰和规范。每一种传统都关系到特定的研究程 
序和实践。每一种传承内部的交流通常是顺畅和富有成效的。然而， 
不同传承之间往往难以交流，误解频仍。当来自某个研究传统的学者 
向另一个传统的成员发表洞见时，这种建议通常被视为是无用和不当 
的。这两种研究传统之间并不协调，存在着误解、怀疑和互挫，有时这 
些标志着定性和定 M 研究者之间的交锋。究其核心，我们认为，社会科 
学中的定性定量之争确实是不同研究传统的碰撞。 

与所有的传承一样，定量传承和定性传承也不是铁板一块(关于“传 
承”概念的精彩论述，参见 Sewdl ， 2005)。它们是被松散地整合起来的传 
统，包含着内部的矛盾和争论。随着时间的推移，构成这些传承的特殊 n 
标和实践已在演变.持续至今。现在，这两种传承不再彼此隔绝•相反 • 它们 
开始相互渗透和跨界。虽然如此，这两种传承还是相对连贯的意义和实践 
系统。它们表现出许多容易识别的价值、信念、规范和程序等特征。 

通过强凋定量和定性研究的差异，本书因而有别于金、基欧汉和维 
巴的著作《社会科学中的研究设计》 （ Do/ 片"/叫 Social Inquiry ： Sci¬ 
entific Inference in Qualitative Research ) 0 他们的著名论断是“定量 
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与定性研究传统仅在风格上有差异，并且这些差异在方法论和实质意 
义上都不重要” (King, Keohane and Verba, 1994:4 )。 他们相信，这两 
种研究传统共享单一推理逻辑，该逻辑推理主要可以通过统计分析的 
规范加以总结。他们识别出来的两种传统之间的差异涉及一些表面特 
质，特别是使用数字还是文字。 

我们拒绝如下假设，即基于统计规范的单一推理逻辑可以冋时指 
导定量和定性研究。我们也不相信定量定性是围绕着数字对文字的使 
用而分立的。相反，我们考虑的是研究的基本取向上的差异.例如学者 
是否主要运用个案内分析 (within-case analysis) 来推断个体个案（如定 
性研究者所做），或是否采用跨个案分析去推断总体（如定量研究者所 
为）。我们甚至建议，最好诉诸两个备择性的数学基础来理解这两个传 
统: 定量研究建立在推断统计学（即概率论和统计学理论)基础上•而定 
性研究则(经常暗含地)根植于逻辑学和集合论。依据这些对比性的数 
学基础来看待这两个传统，有助于理解本书讨论的许多差异。 

在指出基本分歧的过程中，我们的目标并不是将定量和定性研究 
范式分裂开来。相反，本书致力于促进不同范式的研究者之间的交流 
和合作。我们认为，相互理解必然 建立在 对差异的认知与欣赏的基础 
之上，包括理解各自对照性的优缺点。当问题要求研究者所追求的目 
标兼具定性与定量范式的特性时，我们提倡跨界和混合方法的研究。 
与此同时•我们也尊重在每一种范式中进行的研究，从不认为这种研究 
具有内在的劣势。在社会科学中，定量研究、定性研究和混合方法研究 
都占有一 •席 之地。 

从本书引岀的一个教训是，询问定性研究或定量研究是否优于对 
方，这不是一个有益的问法。金、基欧汉 和维巴 （ King，Keohane and 
Verba, 1994:5 — 6) 也声 称:“ 定量研究和定性研究都不优于对方。”然 
而，他们之所以得到此结论，仅仅是因为他们认为当统汁分析不可行 
时•迫不得已才必须使用定性方法。①相比之下，我们认为，定量和定性 


①如他们所说•.“某忤主题可以利用定 M 数据进行统计 h 的假设检验，进而得到有 
意义的衣述•而社会科学家感兴趣的邝 多右题 邰不能如此表述•所以我们不希望鼓励2全 
使用定 M 技术<» ”(King. Keohane and Verba, 1994：6) 
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1 引论 


方法适于不同的研究任务，其设计也是为了达成不同的研究目标。至 
于选用定量还是定性方法，这与恰好可用的数据无关。当然，对于某些 
研究目标而言，定量方法比定性方法更适用，而对于其他研究问题来 
说，定性方法比定量方法更恰当。不过，因任务不同还可能岀现这样的 
情形，即分析者必须两种方法都使用才能达其目标。对于许多复杂的 
研究项目来说，由于完成其目标要求研究者同时使用两种传统的取向 
和特有优势，因此，将定量和定性技术相结合的混合方法研究是关键 
所在。 

与研究其他文化的某些人类学家一样，我们也力图理解一些研究 
实践•并对它们保持某种中立。我们的目标主要是描述性的，基本上不 
是规范性或规定性的。当然，这两种传统中的方法都不能免遭批判。 
然而，我们认为，对方法进行批评和重构最好在一个给定传统的内部进 
行。因此，统计方法论学者是最有资格提升统计方法的研究者•而定性 
方法论者占据着提升定性方法的最佳位置。我们发现，现存的“跨行” 
( cross-cul t u ra 1 ) 批判（比如定性研究者批判定量研究）并不恰切，因为 
他们忽视了那个传统中的基本目标和研究目的。从一类传统的角度看 
可能存在问题，从另外一类传统的视角看却可能完全可以理解。 

我们在讲述这两种传承的故事时，结局总要考察鲜为人知、暗含的 
定性假定和实践如何有别于众所周知、精心编码的定量研究。这种考 
察路数是如下事实的副产品，即与定性方法相比，定量方法在社会科学 
中有更明晰、系统的发展。定量方法更为人所知.在大多数社会科学领 
域，定量传承毫无疑问在两种传承中更占优势。正因如此，我们泼墨去 
探讨定性方法。然而，通篇采用的分析路数仍然是要澄清两种传统的 
特色，同时也避免招致不满的比较。 


1.1 为什么是两种传承? 


金、基欧汉和维巴认为•有一个单一的推理逻辑（即一种基本传 
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承）可以刻画所有社会科学的特征•既包括定量研究•也包括定性研 
究。而另一种“多重传承 ” （many cultures ) 观点则认为，定量和定性传 
统是异质性的群组，每个群组内部都存在许多变体和子传承 （ subcul ¬ 
tures )。 的确，与任何一种传承类似，每个范式又都可以进行或大或 
小的划分。例如，从历史上讲，在统计学范式内有一个大的分割出现 
在经典的频次学派和统计分析的贝叶斯研究之间（例如，参见 Freed - 
man ， 2010； Jackman ， 2009)。对于那些可能赞同例如频次-贝叶斯 
之争的学者来说，他们中间又可能有其他小分工，他们关注的问题有 
诸如混合效应模型的效用或者在一个统计模型中应该包含的自变量 
个数。 

同样，定性范式也有许多分工。可能最大的区分是学者之间的差 
异，有的学者坚持广义的行为研究传统，关注的核心是因果推理，有的 
学者则采用各种解释性方法。这两大派又有各自的子类。例如，推崇 
实现因果推断目标的定性学者可能不赞成某些特定的工具——如反事 
实分析或者定性比较分析 （ Qualitative Comparative Analysis , QCA ) 

的相对重要性。同样，在解释性研究的阵营中，信奉克利福德•格尔茨 
(Clifford Goertz , 1973) 式诠释性分析的学者和提倡批判理论及后结 
构主义方法的学者之间也存在差异。 

我们给出的两种传承分析路数与金、基欧汉和维巴的一种传承分 
析路数有某些相似性，尤其是因为我们的关注点集中指向因果推断和 
普遍概括性。我们所 探讨的 方法和技术都意在用来得出有效的科学推 
断。使用科学方法得出有效的科学推断，这是高于一切的工作，它将本 
书讨论的两种研究传统结合起来了。 

我们对因果推断的关注有一个后果，即定性范式内部的一些重要 
流派将不在分析之列。特别是，在我们的两种传统论证中并没有描绘 
诠释性研究。这些研究路数通常不关注因果分析:它们更专注于其他 
研究目标，如阐释行为的意义或者批判权力的运用。诠释性传统有自 
己的主导规范和实践•基本上不同于本书所研究的定量和定性范式。 
人们当然可以另撰专若，专门 考察诠 释性传承与我们所讨论的“因果推 
断”传承在哪些方面可做对比。这样一部书会公幵社会科学的各个部 
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分内部存在的认识论和本体论的根本冲突。然而在本书中，我们关注 
那些在认识论和本体论的一些根本议题上达成一致——包括认为因果 
分析在理解社会世界方面居于核心——的学者。® 

至于为什么专注于这两种研究传统是有意义的，则有咎种原因。 
一方面，定性定量之分已经植入几乎每一位社会科学者的词典中，并且 
它被作为一个共同的参照点来区分不同类型的研究工作。几乎所有的 
研究者都会谈及定量对定性研究，尽管他们吋能不是按照同样的方式 
来理解这种对比。甚至像我们这样的学者都感觉到，“定量”和“定性” 
这样的标签根本不足以捕捉到两种传统之间的最显著差异，但是我们 
仍然被迫使用这个术语。 

此外，社会科学家已经将自己（正式和非正式地）归入定量和定性 
研究的阵营之中。在政治科学中有两类方法论专业委员会 ，一 类是代 
表定量方法论的政治学方法论专业委员会 (Section on Political Meth ¬ 
odology ) ，较新的一类是定性与多元方法研究专业委员会 （Section on 
Qualitative and Multi-Method Research )。 在社会学中，方法论专业委 
员会 (Section on Methodology ) 主要代表定量方法， | flf 我们所讨论的各 
种定性方法则与比较和历史社会学专业委员会 (Section on Comparative 
and Historical Sociology ) 相关。一些领先的培训机构同样也反映了两 
种传统的分野:政治与社会研究校际联盟 （Interuniversity C'onsortium 
for Political and Social Research , ICPSR ) 提供的几乎都是定量训练， 
而定性与多元方法研究所 (Institute for Qualitative and Multi-Met hod 
Research , IQMR ) 则关注定性和混合方法研究。 

本书的 P 的不是把定量研究者转变成定性研究者，或者反之。然 
而，我们的确努力让更多研究者能够理解这两种研究传承的规范和实 
践及其基本原理。我们认为•在社会科学中•克服定量定性之分显然是 


①我们决定丰书不芩虑 诠释性 研究，这片不证明我1认为此类研究在社会科学中 
没有立足之地。事实上，广义地讲，我们关于两种传承的论证实乃关于描述和解释的操 
练。我们试图阐明两种相对一致的研究传承的实践及相关的意义。因此，洤释性分析者 
虽然作我们描述的定性传承所代表的研究传统中找不到他们的研究传统.似是会发现他 
们的传统中的许多工具会用在我们的分析中。 
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有意义的，它让我们更好地理解两种传统之间的方法论差异，以及差异 
的原因何在。 


1.2 两种传承的特征和比较 

在讨论定量和定性传统之时，我们要利用各类数据资源，并关注某 
些类型的实践而非其他类型。在本节中，我们简单描述用什么方法来 
刻画和比较这两种传承。 

1.2.1 资料类型 


我们对研究实践的刻画来自三种资料。第一，我们依赖于有关定 
量和定性方法论的文献。在一个既定传统中要清晰地显现所使用的研 
究技术及其背后的基本原理，方法论者在此方面经常做出漂亮的成果。 
就定量范式而言，我们大量使用了在统计学、计量经济学和定量社会科 
学领域中著名学者的教材。我们的展示大量援引了有关 Neyman - 
Ru bin-Ho Hand 模型及相关的“潜在结果架构” （ potential outcomes 
framework ) 方面的文献(如 Angrist and Pischke ， 2009; Berk , 2004； 
Freedman ，2010； Morgan and Winship , 2007)。 本书也参考了社会科 
学中关于实验研究的文献。乔瓦尼 • 萨托里 （Giovanni Sartori )、 亚历 
山大 • 乔治 (Alexander George ) 和戴维 • 科利尔 （David Collier ) 等学 
者对定性范式做过一些研究，我们的讨论建立在这些研究中的“经典准 
则” (classic cannon ) 基础之上。另外，我们还借鉴了查尔斯 • 拉金 
(Charles Ragin ) 的许多洞见。在每一章的最后，我们都推荐一些书和 
文章，感兴趣者可以深入阅读这些文献，进一步探讨该章讨论的差异。 

第二，我们利用一些范例性的定量和定性研究来展示每一章中讨 
论的差异。这些研究不仅可用作个案，还可以作为来源提供有关两种 
传承中的特色性实践的洞见。其中的一些范例关注的主题对于两种传 
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统来说都很重要，例如民主研究。从每一种传承的角度来考虑在范例 
性研究中所处理的同一个主题，可使我们更加生动地展示驱动这两种 
传承的不同类型的问题和方法。然而，我们同时有一个重要的论点，即 
某些主题在一种传承中比在另外一种传承中更容易得到探究。因此， 
我们的一些例子并没有跨越两种传承。 

第三，我们也从政治科学和社会学主流期刊的大量研究性论文中 
进行抽样和编码。附录中汇总了所编码的条目及结果。这个大样本意 
在代表好的研究，正如出现在主流的政治科学和社会学期刊中的文章 
所定义的那样。样本也为有关主导性的研究实践的推广提供了进一步 
基础。例如，当我们做出声明，宣布定量研究者在他们的统计模型中经 
常包含几个控制变量的时候，该声明就建立在我们调查结果的基础 
之上。 


1.2.2 显在和潜在的实践 

我们的讨论关注定量和定性范式中的一些占主导的方法论实践。 
通常情况下，在探讨定量研究的时候 • 我们关注那些遵循来自方法论文 
献中建议的显在的实践。定量研究方法和程序经常是明确设定的，并 
且定量研究者往往明确地遵循着这些精心表述的方法论思想。 

然而，我们将在很多方面讨论定量传统中通常隐含的假定和程序。 
比较定量研究与定性研究就是为了引人关注两个传统中潜在的规范和 
实践，否则它们可能不被注意。例如，通过考虑许多定性方法的不对称 
性假定 (assymetry assumption ) ，就可以比较清晰地看到大多数定量方 
法在多大程度上潜在地假定了对称关系。系统地比较这些范式，有助 
于揭示那些经常被认为是理所当然的研究实践。 

在对待定性研究方面，我们更加关注一系列潜在的程序和技术。 
通常情况下，与定量方法相比，定性方法的运用是相当不显见的。实际 
上，在这个阶段，研究方法的潜在使用可能被看做定性研究在传承上的 
特征。为了描述这个研究传统，我们必须重构定性研究者在做研究时 
所使用的程序。我们的重构有赖于广泛阅读定性研究成果，包括努力 
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对诸多定性研究文章进行系统地编码。此外•我们描述的实践与其他 
方法论教材明确地处理和编码的定性研究实践是一致的（例如 ， Bmdy 
and Collier , 2010； George and Bennett ，2005； Ragin ，1987) 0 然而， 

由于定性方法的使用不具有系统性，该传统的某些特征会不可避免地 
引起争议。我们描述的定性研究中的主流实践在某些领域中可能有争 
议，本书尝试指出这些领域。 

1.2.3 典型的实践、最佳的实践与可能的实践 

对于任何传统 来说. 典型的实践和所谓的最佳实践之间都有张力 
(正如被一流方法论专家所识别的那样）。在社会科学中，对“最佳实 
践”的认定通常有很大争议。在一个既定的传统内部•方法论专家就赞 
成还是反对特定的研究程序 进行着 辩论。这些辩论指出了在定性和定 
M 方法论领域内部存在着不同的子领域。例如，在定量方法论领域•大 
多数研究都尝试用观测数据做因果推断，提倡实验的研究者对此却持 
有重大保留意见。 

人们在方法论上争论着什么能够构成最佳实践，本书不参与这些 
争论。取而代之，我们的兴趣点在于描述研究者的实际所为，我们会关 
注定量和定性传统中的典型研究实践，将它们界定为坊间岀版的重要 
成果。我们所考察的实践是进行社会科学分析的标准工具。它们被广 
泛（尽管不普遍）地认为是可以接受的，并适合于进行描述性及因果性 
推断。的确，从更广的学术共同体角度看，这些典型实践都是“好的实 
践”，因为采用这些实践的研究是有影响力的（在枳极意义上），并且通 
常出现在同行评议的顶尖期刊和最权威的出版社所出版的著作中。因 
此，学者常常会生产出被整个学术共同体评为是最好的研究•我们的分 
析就关注这样的一些实践。 

在讨论两种传承实践之间的差异时，我们不否认定量研究者可能 
会模仿定性实践或反之。然而•我们在这里关注的是实际的实践•而不 
是所谓的“可能的实践”。例如，可能去改变统计研究的 Neyman - 
Riibin - Hoi land 模型的构型来处理定性研究中显著的问题，济如对充 
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要条件的分析。然而，在定量传承中，对充要条件的研究并不是一件必 
做之事，事实上，在实践中也从来没有做过。同样，与定性范式相关的 
集合论分析数学模式可用于分析一个总体中的平均因果效应。但是， 
据我们所知，没有任何一位社会科学研究者为了达到此目的而使用过 
这些方法。我们的观点无非是，某些系列的工具会自然带来某呰类型 
的实践而不是其他实践。当一个人在冥想釆用哪些方式将一种传承中 
的工具扩展到另一种传承中易于完成的事项的时候.这些扩展不是自 
然的，并且通常是纯粹假设性的。 

定量范式会更直接地刻画在受到高度关注的研究中通常使用的 
一些做法，因为定量方法在一些有名的教材中都有相当明确的展示。 
应用研究者从这些教材中学习方法•并且通常尽吋能地严格遵照其中 
的规则。当然，教材之间并不总是一致的，它们随时间在变。尽管如 
此，它们为定量传统中的许多共享规范和实践提供了依据。 

在定性传统中，这种情形是比较随意的。尽管谈论起菜谱统计学 
(cookbook stat istics ) 比较容易，我们却从未听闻有人用过“菜谱定性 
分析 ” (cookbook qualitative analysis ) 这种表述。尽管存在着许多定性 
方法教材(著作），但是学生们不要指望在定性方法课程中学到单独的 
一套核心技术。究其原因，部分在于在定性研究内部存在着两类学者 
之间的分立.一类学者集中关注因果推断•另一类则使用诠释性方法 
论。同样，正是由于定性研究对方法的运用是潜在的，才使得与定量范 
式相比，定性研究远远不是标准化的。 

不管怎样，如果我们关注定性研究的因果推断学派，就可以区分出 
并讨论一套潜在的且相当常用的做法。这些做法在许多定性研究名家 
的著述中都可以看到，在有关定性研究的影响力大的方法论著作中也 
有描述，如布雷迪和科利尔 （Brady and Collier, 2010 )， 乔治和贝内特 
(George and Bennett • 2005) ，格林 （ Gerring ， 2007 ) 以 及拉金 （ Ragin ， 
1987) 0 

我们希望，通过考察岀现在高水平期刊和著作中的这些典型实践， 
学者可以就如何做更好的研究提岀新观点。其实现方式可以多元。 
一种可能是，来自一个既定传统的学者可能发现.源自其他传统的某些 
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思想能有助于在他们自己的传统中幵展实践。例如，对于定量研究者 
来说•如何提升测量的效度，有关概念形成的定性分析或许可以提供新 
的洞见。相反，当定性研究者在做出自己的描述性推断的时候，或许可 
以受益于关于测量误差方面的大量统计学文献。这些都显示岀跨行学 
习 （ cross-cultural learning ) 的可行性，这个主题会在本书中多次提及。 

另外一种可能性是 ，一 种给定的实践在研究者自己的传统内部很 
常见，但由于这种实践与研究者自己认为是最好的实践并不一致，因而 
使研究者惊讶。例如提倡 Neyman - Rubin - Holland 模型的定量方法论 

者可能 惊冴地 认识到，实际上该模型能够影响社会科学研究的程度是 
有限的。在定性研究方面，提倡中等样本量的定性比较分析 ( medium - 
N QCA ) 研究的学者可能发现 •对于 大多数定性研究中的因果推断来 
说，个案内分析仍然是核心的基础，这一认识会令他感兴趣。我们认 
为，要想赞同、批判和提升占主导地位的研究实践，就必须对这些实践 
有很好的理解。本书为提升这种理解提供了基础。 


1.3 定性研究有何特色？ 

由于定性方法经常被潜在地运用，因此.我们希望标识出两种重要 
的工具，并相信这两种工具可以刻画区别于定量研究的定性传统的特 
征 。 第一种工具是个案内分析 ( within-case analysis ) 技术•如过程追踪 
法•这些技术在有关政治科学中的定性方法的许多主流研究中被强调 
过，最著名者可能包括亚历山大 • U 乔治和安德鲁 • 贝内特 （Alexander 
L.George and Andrew Bennett ) 所著的《社会科学中的个案分析和理论 
发展》，亨利 • E . 布雷迪和戴维 • 科利尔 （Henry E . Brady and David 
Collier ) 主编的《反思社会研究 ：多元 工具与共享标准》。第二种工具是 
逻辑学与集合论，它们几乎散布在所有主要的定性技术(包括个案内分 
析）中，并且经常与查尔斯 • 拉金 （Charles Ragin , 2000, 2008) 的研究 

关联在一 •起。 
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1.3.1 个案内分析 

区分定量研究和定性研究的一个常用的方法是关注样本量。这很 
自然涉及统计分析的大样本 （ Urge ^ N ) 研究和定性探究的小样本 
(small-N) 研究。金、基欧汉和维巴 （ King，Keohane and Verba, 1994) 

在讨论定性研究时，用很大篇幅来分析定性研究的小样本问题，或分析 
当缺乏足够样本时，应用常规的统计学方法进行推断的难点何在。这 
种分析路数遵循的是一脉相承的研究•即根据自由度问题来考察定性 
方法论 ( Lijphart ， 1971 ； Campbell , 1975) 0 

然而，某些样本量相当大的研究也被认为是定性研究，其他样本量 
相当少的研究却使用主流的统汁学方法（例如•可参见 Collier , Brady 
and Seawright , 2010： 178 一 179)。 这个事实表明，尽管小样本与定性 
研究相关联，但是它不能界定这样的研究。在界定定性研究时，最重要 
的是使用个案内分析，它要求对特定的个案有广泛的了解，这种使用因 
而有利于解释为什么大多数定性研究冇一个小样本。定性研究者可以 
选择一个小样本•因为他们的核心推断方法——个案内分析——要求 
有一种个案导向的分析，而这很难用一个大样本来完成。 

如果人们关注个案内分析.视之为定性研究的核心特性，那么这种 
把定性研究和小样本问题联系起来的思想就不应在讨论之列。显然， 
定性研究体现出自己的因果分析方式。个案内分析涉及要使用一些特 
定片段的数据和信息来对个案进行推断《这些个案内的观测可能成为 
“确凿证据 ” (smoking gun ) ，它明确地支持或反对一个给定的理论。在 
这种情况下，从自由度问题角度来考虑定性方法论是没有用的。 

与定性研究相比，统计学方法显然儿乎都是跨个案分析的工具。 
我们可以在实验方法中看到这一点，实验法往往被作为定量范式中因 
果推断的黄金标准。一个实验涉及两组对照性的被试者，一组得到处 
理•一组被控制。因果推断根本上是围绕这种跨个案的比较建立起来 
的。人们不会试图去解释，比如那些受到处理的特殊个案会发生什么。 
实验法的设计不是为了告诉我们对于任何一位被试者来说，这种处理 
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是否带来结果。尽管观测式分析在很多重要的方面（比如，研究设计) 
不同于实验法，但是它们共享一种基本的跨个案的因果推断法。 

1.3.2 逻辑学和集合论 

当定性研究者在口头上明确表达他们的理论时.他们很自然地在 
使用逻辑学的语言。我们将这种现象称为定性研究和逻辑学之间关系 
的“茄尔丹先生 ” (Monsieur Jourdain ) ^性质。①定性研究者使用逻辑学 
语言，但是他们往往没有意识到这个事实。然而•为了系统地描述定性 
研究的实践•有必要使这种逻辑的潜在使用变得明确化和形式化。 

有关充要条件的思想居于定性研究实践的核心。在定性传统中， 
这些类型的条件被隐含地用于形成众多研究假设。它们是概念形成的 
定性方法、个案选择的定性探究以及儿乎所有假设检验的定性方法的 
核心成分。假设检验的定性方法是围绕充要条件建立起来的•包括穆 
勒的求同法和求异法、重要的过程追踪检验[如箍筛检验 （Hoop tests ) 
和确凿证据检验 (smoking gun tests )] 以及所有的定性比较分析 
( QCA ) 模式。我们的看法是，如果不考虑必要性和充分性的观念•定 
性研究和方法论就不能得到充分的编码和理解。 

有一长串术语直接或间接地表明，研究者在提出假设时使用了逻 
辑学资源。为了表达这样的因果观念，即“ X 对于 Y 来说是必要的' 
研究者要利用一些术语和表述，如“只要……就”、“对……来说是本质 
的、不可少的、必需的、必要的”,“阻碍、否决、阻止”，“是……的必要条 
件”以及“能够、允许、许可”等。在利用逻辑学来表述因果关系的性质 
方面•其中的一些表达是很明确的和直接的，如“只要 X ……就有 Y ”。 
其他的表达就不那么明确，尽管还算清楚，如“ X 对于 Y 来说必不可 


* 茹尔丹 左生 是法国剧作家莫里哀 （ Molicir ) 的剧作《贵人迷》 bourgeois Gentil 
hotnme ) 中的主角。该剧作写的是一位巴黎富商茹尔丹，他一心想当贵族•被别人玩弄却 
还自以为乐，当不成本国贵族 就当一 个土邛其的假贵族。剧中一个人物 ft 豪地卢称•.“一个 
既有钱又 K 得体而的正人荇子比-个肮脏而穷酸的贵族可强得多。” 译者注 

①在莫里 H 的笔下•当茹尔丹得知己的诗歌老师用散文来言说时非常激动。 
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少”或者“并不是 X 阻止了 y ”。 

类似地，有很多术语可以表示研究者理解了 x 是 y 的充分条件。 
在这种情况下，研究者用诸如“保证、确保”，“总是跟随……”，“不可避 
免地导致”以及“带来、生成、产生”等词和表达。其中的一些术语还是 
会比其他表述 (“ X 产生 Y ”) 更直接地表明一种充分关系（例 如： “ Y 总 
是跟随着入”）。 

一旦人们对于自然的逻辑语言的使用变得敏感，就会在社会科学 
文献中随时见到它们。对于定性研究者(或者就此而言，对于任何研究 
者)来说，利用上述列举的一种或多种术语来表达一个口头的理论是非 
常平常的事情。我们遇到过数百个有关必要或充分条件的假设的例 
子。©在所研究的学术问题中•这些假设不是偶然被提 出的； 相反，它们 
居于正在提岀的陈述的核心 （ 有关必要条件假设的150个例子，参见 
Goertz ，2003) 0 

对逻辑学和集合论的应用超出了对假设的表述。为了运用与乔瓦 
尼 • 萨托里 (Giovanni Sartori ，1970) 有关的经典定性方法来定义一个 
概念，需要建构这样一系列条件，即单独看它们是概念的必要条件，整 
合起来就成为概念的充分条件。萨托里传统中的定性研究者“自然”会 
接受逻辑学，将它作为一种架构来思考概念化问题。 ® 同样，当人们使 
用穆勒的求同法来“消除”一个假设时，就潜在地假定该假设有一个必 
要条件。正如我们将看到的那样，甚至主要的过程追踪检验——如“箍 
筛检验”和“确凿证据检验”——都可以基于关于充分性和必要性的观 
念来预测。 


① 这个名单包含许多箸名的比较社会学家，如斯考切波 （ Skocpol ， 1979:154)，穆尔 
( Moore * 1996:118)，吕金迈耶、斯蒂文和斯蒂文斯 ( Rueschemeyer，Stephen and Stephens * 
1992 : 270) 以及政治科学的一些最著名的比较政治学家，如奥唐奈和施米特 （()，Donnell 
and Schmittcr , 1986:65) ，林茨和斯特潘 （Linz and Stepan ，1996:61) ，利瓦伊 ( Levi , 1988： 
141 ) c 在国际关系中 ./ L 乎所有的学界领军人物都会（暗含地）提出这些类型的假设•包括 
(新)实在主义者如华尔兹 ( Waltz ， 1979:121，参见 Levi 和 Thompson (2010) 给出的扩展的 
讨论） ，自由制度主义者如基欧汉 ( Keohane ， 1980:137杨和奥谢恩科 （Young and Oshcr - 
enko , 1993) 以及诸如温特 ( Wcndt ， 1992:396)和芬尼莫尔（[丨即6171101^， 1996:158) 这样的 
社会建构主义者。 

② 当然.萨托 ^l(Sartori) 非常淸楚地知道自己的研究的逻辑基础 
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本书将通篇讨论定性研究的程序和方法借鉴哪些方式来使用逻辑 
概念。实际上，数理逻辑及其同类的集合论在社会科学中还不为大众 
所知，因此，本书需要在序言中简要介绍它们。现在，我们希望强调的 
是，逻辑学和充分性与必要性的观念不仅仅是查尔斯 • 拉金开发的 
QCA 技术中所使用的工具。确切地说，在过去几十年间，它们还是定 
性研究者在他们的多元方法研究中一直在暗中使用的资源。 


1.4 结论 

在本书的最后，我们希望读者对“定量”和“定性”这两个术语有所 
质疑。我们将讨论这两个范式之间大量重要的差异，但是这些差异不 
能用这些术语很好地识别出来，特别是如果这些术语被理解为意味着 
数字对文字的话，就更不能这样来识别了。 

在结论部分，我们总结了本书给岀的许多对比。我们在两种传承 
之间提供了一个共含25个差异的清单。尽管某些差异——如个案内 
分析对跨个案分析以及统计学对逻辑学——是我们论证的核心，但我 
们并不认为任何单个对比能推动所有其他对比。相反，我们的结论是， 
每一种传承都是由许多不同的规范和实践组成的，它们相对一致地共 
同作用在一起。 

展望未来，读者可以有不同的方式阅读本书。尽管我们已经试图 
将各章组成几个连贯的部分，读者也未必按照任何固定的顺序去阅读 
各章。每一章都尝试完整独立成篇。因此，读者可以依据兴趣挑选专 
题去阅读，跳过一些章节也不会有障碍。在利用了充要条件观念的一 
些方法中，需要运用逻辑学和集合论知识。对于在这些方法方面缺乏 
基础的读者来说，数学导引部分有选择地介绍了这些知识。有了导引 
的铺垫，我们应该考虑这两种传承如何以相当不同的方式来看待和解 
释相同的数据，尽管这些方式都是同样正当的。 
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2 数学导引：向社会科学家选介 

逻辑学与集合论 


我的深深抱怨是，政治科学家明显缺乏逻辑学，甚至基础逻辑 
学训练（当然也有例外）。 

- 乔瓦尼 • 萨托里 （Giovanni Sartori) 


2.1 导言 


在本导引中，我们将讨论逻辑学与集合论的一些核心观念，这些观 
念可以引导我们在接下来的章节讨论定性研究。 ® 我们无意对逻辑学 
与集合论领域进行某种全面介绍，因为这需要用一本书的篇幅。相反， 
这里的讨论是有选择的，即我们关注与定性方法论相关的观念 v 尤其是 
涉及必要与充分条件的观念。 

本章的数学导引之所以理当有之，原因在于，定性研究内在的主 
要数学取向——逻辑学与集合论——并不为大多数社会科学家（包 
括大多数隐含地使用这些理论的定性研究者）所熟知。尽管其他学 
术领域(如哲学、系统工程、数学、人工智能和计算机科学）中出现了 
许多关于逻辑学与集合论的著作，但实际上却没有任何面向社会科 


①本书考察的“逻辑学”与“集合论”基本上指的是同样的数学领域。有时候•本书 
自然会讨论和运用逻辑学符号.有时候运用集合论资源则更为容易。有关逻辑学与集合 
论的不同的隐喻式基础，参见拉考夫和努涅斯 （Ukoff and Nunez . 2000)。 


18 



2 数学 导引： 向社会科学家选介逻辑学与集合论 


学的相关著作。©简而言之，本书需要有一章数学导引•因为定性研究 
的数学取向在社会科学中几乎从未被讨论过。 

该讨论也在定性与定量研究之间给出首个主要对 比：它 们建立 
在不同的数学传统基础之上。定量研究侧重于与统计学和概率论相 
关的数学工具。大多数社会科学家对这些工具都很熟悉，因为它们 
在研究方法课程上被广泛地讲授，也明确地用于定量研究中。有人 
甚至说，大多数社会科学家都假定统计学-概率论是社会科学的数 
学。然而我们认为，定性研究通常或明或暗地以集合论与逻辑学为 
基础，并且，如果人们想要比较定性研究与定量研究，就必须理解这些 
数学工具本身。® 

对于我们的讨论来讲•特别重要的是在模糊集合分析中使用的数 
理逻辑。尽管哲学家需要学习逻辑学——正像社会科学家需要学习统 
计学一样，但模糊集合分析却不是关于逻辑学的哲学教材中的主题。 
相反，它经常出现于一些应用领域，如工程学、计算机科学与专家系 
统。专家系统的设汁者使用模糊集合数学来制造“智能”机，其范围涉 
及从洗衣机到电梯再到摄像机 （McNeill and Frciberger , 1994)。尽管 

可以证明模糊集合数学在现实社会中有实际功用，但作为数据分析的 
一种形式工具，它直到最近才被引入社会科学中（如 Smithson , 1988； 
Ragin , 2000, 2008)。 

本导引面对的是定量与定性研究者。对于定量研究者而言，本章 
描述了一种非统计性的研究传承的数学基础。正如逻辑学课程提供的 
工具不会出现在任何统计学课程中一样，本章所讨论的步骤也不同于 
统计学的主要方法。对定性研究者而言，本导引揭示了他们通常隐含 
地使用的数学取向。 


① 査尔斯 • 拉金 (Charles Ragin ) 和其他学者（如 Schneider and Wagemann , forth ¬ 
coming ) tfj 矜述 6 •: 定性比较分析 (Qualitmive Comparative Analysis , Q (' A ) 传统上明确地讨 
论了逻辑学和集合论。然而•仍然没有被广泛使用的教材"了为社会科学家提供导引。 

② 在一些技术类期刊，如《模糊集和系统 》 (Fwsrsrjy Sets and S . v . vMm . s ) 中，关于统计学 
与集合论的对比是一个流行的主题。 
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2.2 自然语言与逻辑学 

当定性学者系统地口述其理论时，他们会非常自然地运用逻辑学 
语言。在上一章.我们涉及定性研究与逻辑学之间关系的“茹尔丹先 
生”性质。定性研究者谈及的是逻辑学语言4旦他们通常没有完全意识 
到这一事实。 ® 

运用逻辑学和集合论来表述的理论通常具备两个成分。第一，这 
种理论将概念视为集合或范畴，其中的个案（或观测项）可以具有成员 
资格 • 也可能包括部分程度的成员资格。在日常语言中，诸如民主、发 
展与战争这样的概念被视作范畴，而其中的特定个案可能具备或不具 
备其成员资格，或者具备一定程度的成员资格（参见 Lakoff , 1987)。 
如下所述，在概念分析方面，逻辑学与集合论保留了许多日常语言。 

第二，在两个或多个概念之间有某些有假设性的、用逻辑学术语来 
构想的关联，其中要用到有关必要性和/或充分性，或与之对等的超集/ 
子集关系的思想。尽管某些研究者可能一打眼就认为必要性和/或充 
分性观念对社会科学研究来说是不适当的，本书却认为情况并非如此。 
正如导言部分所说，相当多的学者在提出假设、建构概念、选择个案和 
检验假 设时. 都使用了必要性/充分性思想。 

我们可以比较定性传承中的自然逻辑学语言和定量传承中的概率 
论与统计学语言。儿乎所有人都熟悉后者，因为几乎每个人都在统计 
学课程上学习过，并从运用统计方法的期刊文章上 f 解到它。例如，为 
人熟知的公式 包括： 

* 在乂出现或发生的情况下， y 发生的概率增加（或降低）。 

嫌在 x 出现或发生的情况下， y 平均而言发生的概率增加 

(或降低）。 


①形式建模者也会论及必要与充分条件。在一鸣数学定繩 （ 如在经济学或博弈论 
领域）中，提供必要和/或充分条件是很常见的（例子参见 （ hertz ，2003 b )。 然而，当实施经 
验检验时，则由统计学范式接手过来了。 



2 数学 导引： 向社会科学家选介逻辑学与集合论 


X 与 Y 之间关系的函数形式有多种.这取决于所使用的特定统计 
模型。例如，函数形式 wf 以是线性的常规最小二乘法 (（) LS ) 回归、曲线 
形状的概率单位 ( prohit ) 或 logit 以及其他统计模型的对数线性形式， 
如贸易引力模型 (gravity model of trade )。 当使用概率模型时，函数式 
可能仍然未被 设定： P(Y I X )=^ P(Y I ^ X ) 0 

在两种传承中，学者有时没有注意到统汁假设与逻辑假设的任何 
K 别。当他彳1陈述自己的假设吋，甚至可能在这两种假设之间反复切 
换•好像两者可以互换一样。例如，当华尔兹主要使用自然语言的逻辑 
来陈述假设时，他在某一点指出 ：“团 体越小……一些成员 即越多 
的成员——将越可能为团体的利益而行动……一个单位的相对规模越 
大，它越有能将自己的利益与系统的利益认同起来。” （ Waltz ， 1979： 
198) 在此，我们看到了典型的定量传承语言。然而•他在最后一章屮回 
归到了逻辑学，并主张“在当前条件下，广泛的国际合作只有在美国的 
领导下才是可能的”（1979:210)。 

在整个经验社会科学领域中有一个基本问题，即如何将口头的理 
论形式化以便诉诸检验。人们能否真实地将用逻辑学术语表述的 U 头 
理论转化为与常规的统计方法一致的形式？同样，人们能否将依据概 
率论与统计学术语表述的某种理论重塑为一种建立在必要与充分条件 
基础上的理论？这些问题提出了我们所谓的转译问题 （translation 
problem ). 为了探究跨范式的转换为什么会成力一个问题，我们需要 
更细致地考察逻辑学与集合论。 


2.3 带有二分类的必要与充分条件 

2.3.1 集合论与维恩图 

有时候，定性分析者明确地使用有关必要性与充分性的逻辑学术 
语•但同样是这些研究者•他们却很少明确地运用集合论术语。不过， 
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命题逻辑与集合论是密切相关的，通常可以互换使用。这种转译工作 
如下： 


• ‘‘X 是 y 的一个必要条件”等价于 “y 是 x 的一个子集”。 

籲“ X 是 y 的一个充分条件”等价于“ X 是 y 的一个子集”。 

图 2.1 运用维恩图 （Venn diagrams ) 来展示这种思想。为了向这 
些图中加入内容，可以使用几个简单的范畴实例。在图 2.1 a 中 ，令 Y 
表示未通过基础逻辑学课程期末考试的学生集合， X 表示缺席基础逻 
辑学期末考试的学生集合。那么，缺席期末考试的集合中的成员就是 
未通过课程考试的学生集合的一个充分条件。 X 是 Y 的充分但不必 
要条件，因为还有其他课程不合格的原因（例如，课程论文不及格）。这 
种通向同一结果的多种途径的观念被称作“殊途同归” ( equrfinality )。 



a 充分条件 b 必要条件 

图 2.1 用维恩图展示的必要条件与充分条件 


为了向图 2.1 b 增加简单的内容，可以假设 Y 表示所有怀孕个体的 
集合， X 表示所有女性个体的集合。那么，某成员属于女性集合，是其 
属于怀孕个体集合的必要条件。因此， X 不是 Y 的充分条件，因为如 
维恩图所明示，还有许多女性未怀孕。 

集合论语言可以通过多种表达形式隐含地出现在数据分析中，其 
中的一种形式是“所有 X 都是 Y ”。 如果学者说“所有 X 都是 Y ”， 那么 
她也是在说 X 是 Y 的一个子集。相反地，如果她说“所有 Y 都是 X ”， 
那么 Y 就是 X 的一个子集。从集合论的视角看，在“所有 X 是 y ” 与 
“所有 Y 是 X ”之间有很大差别。但是，怎样将这种思想转译成定量语 
言呢？这两种陈述都意味着 X 与 Y 之间的某种 关系； 对于二者来说， 
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X 与 Y 之间通常存在某种密切的关系。但是•如何将集合论的陈述转 
译为概率论或统计学的语言，这仍然不是一目了然的。原则上，我们大 
概可以进行这样的转换（例如，某些转译可参见 Gomz ，2003 a : 第10 
章; Cioffi - Revilla ; 1998； Seawright ，2011) ，但这并非自然而然或轻而 
易举能够完成的。 

定性研究者在尝试将一种线性相关或统汁关联转换为必要与充分 
条件的时候会面临难题，上述转换问题类似于此难题。虽然有许多方法 
可以进行这种转换(例如 Eliason and Stryker, 2009) ， 但这些方法是有局 
限的和勉强的。正如我们的两种传承隐喻所示，在一种传承中是显见和 
容易之事通常在另一种传承中是有问题和困难的(尽管不是不可能的）。 

2.3.2 2 X 2 表 

学者在描述必要或充分条件的时候，最常见的方法可能是运用 
2 X 2 表。表 2.1 a 和表 2.1 b 展示了这些条件在二分类别中是如何出现 
的。为了有助于记住必要条件与充分条件的差异，我们可以使用前文 
展示的例子 :在表 2.1 a 中，成为女性 （X = 1) 是怀孕 （ Y = 1) 的必要条 
件; 在表 2.1 b 中，缺席终考 (X = l ) 是未通过考试 ( Y 二 1) 的充分条件。 

表 2.1 运用 2 X 2 表来展示必要条件与充分条件 

a 必要条件 
X 

0 1 

1 

y 

0 

b 充分条件 
X 

0 

1 

y 

0 


N , 

n 2 


0 


0 

n 2 

N 3 
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当运用 2 X 2 表的术语表达时，说 X 是 Y 的必要条件则意味着三 
种相互关联的情形： （ 1广没有 Y = 1会是 X =0”；（2)“所有 X =0 都是 
Y =0” ； （ 3 ) “所有7 = 1都是 X = 1”。因此，用我们的例子来说，这就意 
味着：（1)没有怀孕之人不是女性（即为男 性）； （2) 所有非女性（即男性) 
都不怀孕;(3)所有怀孕之人都是女性。①2 X 2表的关键特征是，单元格 
(^ X , y ) 是空的 ( iX 读作“非 X ”）。事实上，可以将该单元称为一 
个 2 X 2 表的必要条件单元 (necessary condition cell )。 与之类似，在表 
2.1 b 中，充分条件单元是 ( x ，~- y )， 因为要想充分条件成立，该单元格 
必须为0。 

表 2.2 —个充分条件的例子 ：民主 式和平 


非民主二方组 民主二方组 

和平 
战争 

资料来源 : R ussett , 

为了将这种讨论建立在社会科学基础之上，比我们考察表 L 2 中 
给岀的民主式和平 （democratic peace ) 涉及的数据。当评价民主式和 
平理论的时候，涉及的个案都是由国家组成的二方组 （ dyads )( 即一对 
国家）。所关注的主要结果是和平，它被看成是一个二分类范畴，和平 
的对立面是战争（该观点将在“概念的对立面与类型学”一章中进行论 
辩，但这里用此概念是很适合的）。“民主二方组 ” （democratic dyads ) 

作为原因的要素，也是一种二分范畴。只有当两个国家都是民主政体 
时，二者才构成一个民主二方组。只要其中一个或两个国家不是民主 
政体，该二方组就是“非民主二方组”。 

从逻辑学的角度讲， 2 X 2 表中的数据是充分条件的一个绝佳个 
案。具体而言,“民主二方组 X ”是“和平 Y ” 的充分条件。这一点可以 
在该表中清晰地看到，其中民主二方组与战争对应的单兀是空的，所有 


①一些研究者会声称•“非女性”不等于男性。正如我们将在第13章所讨论的，一个 
范畴的否不等于该范畴的对立面。 


1 045 

169 

36 

0 


1995：174 
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的民主二方组个案都处在和平单元格中。 

当然，人们可以针对如表 2.2 这样的 2 X 2 表计算统计量。结果将 
因使用的统计量不同而有所差别。例如，针对表 2.2 的数据计算卡方 
统计量 X 2 ,可得到卡方值5.80,显著性水平为0.02。斯皮尔曼和皮尔 
森相关系数值为一0.07,在 0.006 水平上是统计显著的。①发生比率 
(odds ratio ) 则更有启示意义 :它在 0.08 的水平上是非常显著的（发生 
比率如果等于1，意味着没有 关系; 其值越接近0或远远大于1，则表明 
是非常显著的结果）。如此看来，用 logit 分析计算得到的发生比率表 
明，民主二方组实质上比非民主二方组更讲和平。然而，这些标准的统 
汁 量都不能挖掘到这样的事实，即该数据与充分性关系是完全一致的。 

关于必要条件的陈述总是能够被转换为关于充分条件的陈述（反 
之亦可）。在从必要性转换到充分性(或者反之)时，只要简单地否定所 
分析的范畴，就可以实现这种转换。例如，如果 X 是 Y 的充分条件，那 
么 nX 是的必要条件。在民主与和平的个案中，可以将一个重要 
发现表述 如下： 民主二方组的缺失是战争发生的一个必要条件。 

在逻辑上，人们通常不会混淆必要条件与充分 条件; 对于统计方法 
来说，同样会岀现这样的关系。事实上，不考虑数据的分布是否呈现为 
必要条件或充分条件，计算 2 X 2 表的诸多相关系数结果会完全相同。 
确实如此，因为标准的相关系数计算方法假定有对称关系，其设计并不 
是用来探测和概括非对称关系的。 

当然，对于许多 2 X 2 数据集的个案来说，用对称的相关测度来分 
析其分布是适用的。对于双变量相关分析来说，这的确为真。在这样 
的分析中，个案都集中在两个对角线单元上(例如，如果是正相关，个案 
则集中在左下与右上的单元中）。当一位头脑中装备了逻辑学与集合 
论的学者面对这样一个对称的数据集时，他或她可能将其视为具有某 
些必要性和某些充分性。这样来解释数据没有任何错误。关键在于， 
当使用逻辑学与集合论时，根据对称相关来思考这些关系是欠妥当的 


①严格地讲，气存在零单元格时 ，许多 2 X 2 表的相关系数（如 X 2 )是不能计算的。 
然而，大多数统 汁软件 包具有标准的补丁程序•允许计算这些统计董。 
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(尽管不是不可能）。 

关于 2 X 2 表的这种讨论展示了所谓的罗夏测验原理 （Korwhach 
Principle ). 进行罗夏测验时要向人们展示模糊不清的图像•并要求他 
们作岀解释。对社会科学家而言•数据可以发挥同样的作用。毕竟，数 
据不足以支持珂论•这是科学的一项核心原则。人们可以考察相同的 
数据，却合法地看到不同的东西。没有哪一种看待数据的方法是绝对 
正确的(尽管并非所有的看待数据方法都同样有用）。 2 X 2 表说明，人 
们在数据中如何看到不同的模式，这取决于各 S 的研究 H 的。 

2.3.3 真值表 

在以逻辑学为基础的研究中会采用真值表，它类似于在统计分析 
中所分析的数椐集.尽管它们在令人感兴趣的某些方面有所不同。表 
2.3 给出了一个真值表。正如在定量的矩形数据集合中一样，列表示变 
量。由于这是一个“经验”真值表，它也包含第四列来表示经验观测值， 


这些值对应于真值的每- 

7章)。 

一种配置 ( configuration ) (详见 Ragin ， 

表 2.3 经验真值表 

1987:第 

X , 

x 2 

Y 

N 

1 

1 

1 

5 

1 

1 

0 

0 

1 

0 

1 

3 

1 

0 

0 

K ) 

0 

1 

1 

0 

0 

1 

0 

7 

0 

0 

1 

0 

0 

0 

0 

12 


尽管大部分列看上去与统计分析中的矩形数据集相类似，但是行 
却大不相同。在一个统计数据集中，行是观测值。相比之 " F ， 真值表中 
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的行却是真值的 W 置。这里列 举了逻 辑上所奋 " j 能的配置，使得变 M 
数决定着行数。行数与观测值的数目无关。某一行，比如第一行•是这 
样一个逻辑陈述=1且 X 2 = l 且 Y = l 。 数据与该陈述可能一致 
或不一致(表 2.3 的数据是一致的，无矛盾）。 

作为一种 方法论 •定性比较分析 (Qualitative ('omparative Analysis ， 
Q (' A ) 可以描述和分析嵌入在沾如本真值表中的逻辑关系 （ Kagin ， 
1987, 2000)。它运用布尔代数数学（如布尔极小化和蕴涵 [Boolean 
minimization and implication ]) 将逻辑表述还原为更简化的形式。我 
们希望强调的是，变量值的配置(并 I 卩申个变量）沟成了分析的核心。 

通常情况下,一种配置就是对两个或多个变量仿的组合(或交集）， 
这些变量组合在一起_成为某个结果的充分条件。构成一个配置的逐 
个个体变量值是通过逻辑“与” （ AND ) 关联在一起的。这些个体变量 
值通常是“充分非必要条件的必要非充分部分 ”（1 NUS conditions ) (或 
者它们可能是必要条件; Mackie ， 1965, 1980) 。 ① INUS 条件是这样的 
一些变量值.即它们的每一个值对于所研究的结果来说都既非必要也 
t 充分。相反•它们是诸多变量值的一种总配置的本质（即非冗余的) 
要素，这些变量值构成 r 结果的允分条件。因此，当变量值的某种组合 
足以产生一个结果吋，单个变量值就或者是必要条件,或者是 inus 条 
件。如果是后者，即殊途同归总是存在的•这意味着通向同一结果之途 
不止一条。 

我们可以利用统汁方法来分析表 2.3 中的数据。但是•不能按照 
给定的方式来分析数据。例如•需要将行转换成观测值。由于有37个 
观测值，统计数据集将有37行。进行这一步时，在真值表中那些没有 
个案的逻辑配置（即第二、五、七行)事实上将不做进一步考察。 统汁分 
析者可能探讨每一个自变量 （ Xi 和 X 2 ) 与 Y 之间的协变性。相比之 
下，采用定性比较分析的学者可能将数据中令人感兴趣的模式总结 
如下： 


①首字母缩写 INUS 源自麦凯 （ Maekic . 1965:246) 的如 K 所述 ：“对 于一个结果来 
说•所谓的原因是该结果得以成立的一个作必要但充分的 (unnecessary but sufficient ) 条件 
中的耶个非充分 ffi 必嬰的 （ insufficient l)ui necessary ) 部分 Q ” 
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籲 X , =1是 Y = 1 的一个潜在的必要条件。 

籲； ^ =1且 X 2 -l 是 Y =1 的一个潜在的充分条件组合。 

考察^与 Y 之间以及乂 2 与 Y 之间的统计共变特征，这根本就 
不对。与利用基于逻辑学的方法来汇总结果相比，这种分析既非更正 
确也非更错误。它无非揭示了数据的一个不同方面罢了。比较理想化 
的是.给定了研究的问题与目标后，为了提请注意数据的最相关特征 • 
人们会有办法并倾向于从多个视角来考察数据。 


2.4 模糊集的必要和充分条件 

亚里士多德的逻辑学和我们熟知的清晰集合论 （ crisp-set theory ) 
将概念或变量看成是二分的，即个案或者是其成员，或者不是。某类别 
中的成员属性通常表示为数量 1( 即 X = l ) •成员属性的缺失被表示为 
数值 0( 即 X =0)。 模糊逻辑的一个特色在于，允许个案在一定程度上 
隶属于某类。完全的成员资格仍然标记为数值1，完全的非成员资格 
值是0。但是•个案可以有0到1之间的任何值（例如 ，X =0.75, X = 
0.33, X =0.10)，这取决于它们在多大程度上属于所感兴趣的类别。 
如此看来，一个给定的个案属于“战争”类別的成员资格值可以是 0 . 5 , 
这表明该个案居于该类内、外的程度是一样的。 

我们可以在 2 X 2 表中 i 、 j ■论必要条件和充分条件，与之类似，也可 
以针对 x 和 y 之间的连续散点图讨论必要和充分条件。就模糊集分 
析来说这是可能和自然的，因为个案在集合中的成员资格可以用 () 到 
1之间的值来连续地测量。当针对两个类別来绘制模糊集数值的图像 
时，必须使 X 轴和 Y 轴的范围在0到1之间连续变化。 

虽然大多数学者没有经过任何特殊的训练就用充分条件和必要条 
件来解释 2 X 2 表，但对于模糊集散点图来说情况并非如此。在 2 X 2 
情况下，我们要注意到与充分条件和必要条件有联系的空单元。那么 
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对于连续编码的模糊集来说，我们要注意什么呢？ 

图 2.2 a 和图 2.2!) 分别表示的是，当将个案绘制到一个模糊集散点 
图上的时候•必要条件和充分条件看起来是什么样子的（参见 Ragin - 
2000)。 它们表现为“三角形”散 点图。 右下方的三角形散点图是一个 
必要条件，左 h 方的三角形散点图是充分条件。 我们可 以把散点图看 
做对我们所分析的 2 X 2 表的扩展。在这些表中 .3/4 的单元格有数 
据。有数据的这三个单元格构成了一个类似三角形的形状。这样看 
来，如果描绘这些表，就町以得到如图 2.2 中的散点图。 

更正式地说，针对一个必要条件( X )的模糊逻辑规则是•所有个案 
在 x 上的模糊集值必须大于或等于其在 y 上 的值： 

入是 Y 的必要条件：对于所 有的/ 来说 ， a > ： v , ，^， ： v , 6 

[0, 1]。 


其背后的观念是, X 要想成为 Y 的一个必要条件，就要求一个个案隶 
属于 X 的程度必须不小于其隶属于 y 的程度，否则，说 X 是 Y 的必要 
条件就没有什么意义。举个例子.如果一个个案隶属于 X 的程度很小 
(例如 0.1) •却完全是 Y 的成员（即 1.0). 那么就不能说该个案隶属于 
X 的程度对于它属于 Y 的程度而言是必要的•否则就会出错（除非做 
出其他特殊的假定）。 

相比之下.当论及模糊逻辑中的充分条件时•其意思是说所有个案 
在 X 上的模糊集合值 （ fuzzy-set values) 将小亍或等于它们在 V 7 上 

的值： 


A ■是 V "的充 分条件 ：对于 所有的/来说 ， a < %^， ： y , 6 

[0, 1]。 


这里的观念是，如果 x 是 y 的允分条件，那么一个个案成为 y 中成员 
的程度必须不小于其成为 x 中成员的程度。例如，如果一个个案完全 
是 Y 的成员（即1.0)，何是仅在较小程度上成为 X 中的成员（如0.1)， 
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注:虚 线是 （) SL 线。 

h 充分条件 

图 2.2 模糊逻辑 ：必要 条件和充分条件图示 

如果 N 到前义讨论的维恩图（即图 2. 1 ) .我们会在明确集（即二分 
的集合）和模糊集之间的关系上看到如下一 致性： 


那么说它是 X 的成员就潜在地足以说明它可以成为 Y 的成员，这不会 
有问题。 



注: 虚线是 （) LS 线。 

a 必要条件 
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充分 条件： = 

甚至符号看起来都相似，这并不是偶然的。 

从统 i 卜学视角出发，对散点图实施罗夏测验就是有益的。对于刚 
刚修完一两门 Na 课程的人来说，这些散点 m 有哪些特征会引人注 

意呢？ 


1. 适度拟合。人们可以画一条线穿过数据，发现在 x 和 Y 之 
间有一个清晰但适度的关系。 

2. 斜率。图 2.2 a 中的 OLS 斜率与图 2.21) 中的 OLS 斜率是 
一样的。 

3. 异方差性。围绕 （)LS 线的方差明显不是常量。 

让我们从两种传承的角度依次考察这三点。符先.从模糊逻辑的 
角度看•阁 2.2 中的散点阁 n 〖以看做完美的拟合 （perfect fits ) 0 对于一 
个必要条件来说， 4 彳所有的观测值都位于或者低于 45 ° 的对角线（根据 
上述的必要条件定义）的时候.就发生了完美拟合。同样地•对于一个 
充分条件而言，在所有的观测值都位于或者高于45°对角线的时候，就 
发生了完美拟合。相比之下，在 OLS 回归模型中•当全部点都恰好落 
在 （) LS 线上的时候，才发生完美拟合。 

其次.从统汁学角度讲，图 2.2 的两个散点图中 x 和 y 的关系基 
本 相同。 截距固然不同，但那些参数很少是人们的兴趣点。相比之下 • 
在模糊集分析中•人 f I ' ] 就不能得出结论认为这两个散点图代表着相 M 
的 关系： 在一张 m 屮发现 X 对 V ’足必要的，在 >} 一张 m 中却发现 X 对 
Y 是充分的.可以认为这两 t 发现完全不同。这一点与我们在2 X 2表 
中看到的完全一致。定性传承将一个灰看做必要条件.另一个表行做 
充分条件，定 M 传承却将这两个表解释成代表同样的关系。 

当然，从集合论角度看•这些都是不对称的散点图，因此，它们对于 
展不集合论的潜在功川是非常有用的。然 rfH •如果人们开始分析的是 
这样的两个对称散点图•即其中的点都随机分散在直线周围，那么定量 
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视角可以强调指出其中的细微差别和不同点，而这些是用集合论工具 
难以表达的。再次强调的是,我们的观点并不是说一个视角正确而另 
一个视角错误。确切地说，我们认为，这些视角可以注意到数据的不同 
特征。集合论模型对于分析不对称关系来说是非常有用的（虽然它们 
也可以用来研究对称关系）。 

再次，在面对异方差性数据的时候，标准的统计学反应是对变量进 
行转换，使之达至常量的方差。在定量传统中，这种转换对于有效的统 
汁推断来说可能非常重要。相比之下，定性研究者通常并不进行这种 
转换。对他们来说，转换一个变量通常意味着改变其意义。除非显示 
这样的转换能够增加被分析的基本概念的意义，否则变换就是不恰当 
的(参见第12章）。 


2.5 聚合 

方法论中有一个基本问题是选择什么方式来聚合 ( agg r ega t i o n ) 数 
据。为了便于说明，让我们将聚合定义为一个函数/，人们用这个函数 
将各个 x 组合在一起得到 y : Y =/( X ,, X 2 , …）。函数/可以釆取 
很多不同的形式，这取决于人们采用什么方法和假定。逻辑学和统计 
学都有各自关于聚合程序的独特的、默认的假定。 

在统计学中，一种常见的聚合技术就是加权和。如下所示的一般 
线性模型就是一个好 例子： 

Y =w 0 + iV]X I + w?Xz + ••• (2.1) 

这里的 Y 是各个 X 的加权和。当权数都是 1// V 时，就得到加权 
聚合的一个特例，即均值。 

另一个常见的统计聚合形式是交互项 ^ X 2 o 通常情况下，交 
互项应该是诸如方程 （2.1) 这样的更大的加权线性聚合项的一部分。 
然而，如下所示的包含一个纯交互项的聚合模型也不是不可能 有的： 
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Y = XT * XT * * — (2.2) 

在实践中，这种方程会被转化为如方程 (2.1) 那样的对数线性模型。在 
实施聚合的时候•定量传承当然不限于加法和乘法。伹是•出于某些良 
好的实用性和统计学原因，大多数统汁模型都是加权总和或对数线性 
的加权和。 

对于或明或暗地使用逻辑学和集合论的学者来说.他们使用的标 
准聚合技术有哪些？我们对表 2.3 中真值表的讨论给岀了大量的例 
子•每一行有一例，它们都有同样的基本形式。例如，第一行可 读作： 

入1=1 与入2 = 1 与 Y = 1 (2.3) 

逻辑“与” ( AND ) 将诸多条件联系在一起，变成诸多条件的一个总 
组合。在布尔代数中，逻辑“与”经常写作乘法符号 （* )。 

如果人们希望进一步比较逻辑学和统汁学，就可以尝试在逻辑 
“与”和统计乘法之间转译。这两个数学运算可以写成同样的 形式: 
y - x , ^ x 2 o 如杲 x , 是二分变量，这个类比就是有效的。当超出二 
分变量时，关于“与”和乘法的类比就开始无效。例如•如果将变量理解 
成在 [ o . 1] 上连续编码的模糊集•就可以针对方程 (2.3) 追问聚合程序。 
在逻辑学中，用逻辑“与” ( ANDK 即布尔代数中的乘法符号）计算一个 
个案的成员资格属性的标准规则是利用 X 的最 小值： 

Y = min ( X | , X -> , ，…），入’，6 [0, 1] (2.4) 

因此，有了逻辑“与”，一个个案隶属于 Y 的成员资格值就等于其在集 
合中的 M 小值。例如，如果在集合 X 中，最小的模糊集值是 0. 1，那 
么该个案隶属于 Y 的程度值就是0.1。对于二分变量来说，运用逻辑 
“与”的最小值也很管用。 

更明确 地说： 

乘法不同于运用最小值。 

诸如此类的差异居于两种传承之争的核心。统汁分析中的乘法和集合 
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论分析中的逻辑“与”类似，但是它们的数学过程却不 M 。 此外 •一 个过 
程并不是内在地优于另一个过程。它们只是不同的数据聚合方法罢 
r 。在某些理论的或实质的情景下，学者可能有理由优先选择其中的 
一种聚合模式而不选择另外一种。但是，并不存在先验的现由相信某 
种聚合模型应该被首选。 

两种传承之隐喻也允许人们吋以运用对方传承中的聚合技术。原 
则上讲，没有什么道理可以阻止统计学传承使用 模型： y -/3 u +/3, X 1 + 
min ( X 2 , X ,) 0 同样，加权总和与乘法在模糊逻辑系统内也是可能 
的。然而，这两种情况至少在社会科学中是不&然的，也不常 ffl 。 

上文讨论 r 乘法和逻辑“与”的关系•那么对 T 1 加法来说. ik 有类似 
的关系吗？逻料“或 ”(（ m ) 扮演了在利用逻辑式进行聚合时的加法角 
色。在布尔代数中•逻辑“或”被写作加号（ + )，这又一次强调 r 类比 
性。在利用逻辑“或”来计算个案的成员资格程度的时候.一般规则是 
运用个案在集合 x 中的成员资格的最 大值： 

Y = max(XI • X2 ， X ” …）， X , G [0， 1] (2.5) 

例如，如果集合 X 中的最大模糊集合值是0.85,邠么个案成为集合 Y 
的成员的程度值就是 0.85 c 这个方程也适用于二分变量，因此，我们可 
以将它看成是针对逻辑“或”的一般聚合程序。 

需要再次明确的是，加法与运用最大 逍是不 同的。虽然它们 " r 能 
产生同样的结 采. 但通常不会如此。再强调一次•我们的论断不是说某 
个数学过程优 f 另一个。已知它们在各自的研究传承中是标准聚合程 
序的情况下，我们仅试图关注它们的差异。 


2.6 面对数据的模型 

如何评价经验数据和理论、模型、假设之间的“拟合” •这足一个基 
本的科学活动。在社会科学内部.这类评价通常 [ tl 统计分析来进行。 
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例如，就总休的模型拟合而言是一个经典测度（尽管在当代定量社 
会科学屮总休拟合测度不再被认为是非常重要的）。要想考察单个变 
量的拟合度，人们需要追问数据是否“支持”关于该变量的假设。例如- 
人们会考察单个变量的因果效应和统计显著性。 

但是，在逻辑学或集合论中如何评价一个模型或原因要素？什么 
样的标准可以评价模型的“拟合度”或某个既定的原 W 要素的“讯要 
性”？本节将探究这些问题。不管是否用到定性比较分析 （ QCA )， 我 
们讨论的观念都与定性研究相关。 

2.6.1 拟合与一致性 

在 if 价一个理论或模型的拟合度时，一项坫本要求是该理论或模 
嗯能够对数据做出明确的预测（预测本身可以采取不 N 的形式）。如果 
预测是明晰的，人们就可以 问：数 据与模型在多大程度1:一致?在统计 
模型中，高度一致的数据会靠近或落在模型所描述的直线上(假定它是 
一个参数模型）。学生在第一 n 统 M •学课堂上•通常学习如何用肉眼看 
双变量散点图，考察是否存在一条拟合数据的线。 

在集合论分析中 ，“一 致性”这个术语被学者用作一种拟合测度，用 
它来分析关于必要或充分条件的假设 （ Kagm , 2⑻8)。不论用二分测 
度还是模糊集编码来测置必要和充分条件假设，都可以明确地预测数 
据的模式。就2 X 2表这个简单例子（参考表2 . 1 ) 米说 ，一 个必 要条件 
假定会 顶测住 V 7 )单元格中应该没有个案。人们可以想象各种 
场絷使得该单元不包含个案•而这只占一小部分。这些个案是所研究 
假设的“反例”。在图 2.1 中，如果有理由认为 / V 2 、/ V :< 、 iVi 的值大，那 
么在 (1 m 单元格中的这“小部分”个案便意味着一致性不是 0* 分 
之百的，但是仍然足够大到可以支持假设。数椐可能显示 ， y = 1行中 
95%的个案(这 里选 统比学的一个流行标准)位 f ( X , Y ) 中.元格中 （m 
想一下•必嬰条件的一种定义就是所有的 y = 1都是 x = 1 ) 。耦于此 • 
人们可以声称数据与必要条件假定是相当一致的。 

这种基本观点 M 样适用于模糊集假设 3 如图 2.2 所示，如果数枢 
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与充分条件假设是完美一致的，它们必然落在或高于45°对角线上。当 
观测值移动到低于45°对角线时 ，一 致性会减弱。这里的窍门是设计一 
个公式(参见 Ragim 2008) •用它来总结这些观测值不一致的程度。这 
类似于在 （) LS 回归中，用离差平方和除以总变异 ：它总 结了各个观测 
值同 （) LS 线相比的不一致程度。 

简而言之，有-些经过了良好设计的方法可用来评价基于逻辑的假 
设和模型在多大程度 h 与数据拟合。虽然在此过程中所用的具体公式 
不同于统计学中的共识•但是其道理是相同的，即将模型的预测值与实 
际数据进行对比。如果它们接近•模型或理论通常就得到了数据的支持。 

2.6.2 评价重要 性：覆 盖度和琐碎性 

有些假设是用必要条件来表述的。就这样的假设而言，人们有时 
候提出这样一个关切的问题，即某个 W 素可能是一个结果的必要原因， 
但它却是琐碎的原因 （trivial cause ) 。⑴关于这个关切的问题，乔治•唐 
斯 (George Downs ) 提供了很好的 陈述: “对于任何现象来说，都存在着 
无数个必要条件。例如•不可否认,所有的军队都需要水和重力才能运 
转，但是这些普遍项的贡献不大。” ( Downs , 1989：234) 

在对琐碎性的这种批判内部包含着这样一种观念，即必要（或充 
分)条件因其“重要性”而变。在统 i I •模型中有几种方式可以决定某个 
给定变 S 的重要性。例如，直线的斜韦是某个变 S 的重要性的一个指 
标:斜 率越陡，通常意味着变量越重要。为了测量充分条件和必要条件 
的相对重要性，也可以制定严格的标准。实际上，唐斯的论证提供了一 
个有用的出发点。他暗指某些必要条件无足轻重,因为它们一直存在。 
这种观测表明，必要条件的相对频次可能与它们的重要性有关。 

我们可以用集合论工具来系统地思考这个问题 （ Ragin , 2008； 
Goerts , 2006)。 X 如果是 Y 的必要条件，则 X 是 Y 的一个父集 （ sn - 


①打意思的是•虽然这# 义切 对丁必要条件来说经常出现，似是学者并不经常提出 
它们，或者至少不会针对充分条件明确地提出它们。 


36 




2 数学 导引： 向社会科学家选介逻 机学与 集合论 


persetM 换言之，即 Y 是 X 的子集）。这个定义并没有告诉我们 X 集 
合与 V 7 集合之间关系的相对规模。作为一项规则，如果必要条件 X 在 
与 Y 集合的关联中成为后者的一个较小父集，则 X 会更 重要; 也就是 
说， X 集合会随着与 Y 集合趋于有完美的重叠而变得愈发重要。 

另外一个思考该问题的方法是，洵问一个“琐碎的”或不重要的必 
要条件的对立面是什么。显见的答案是，一个必要条件同时也是结果 
的充分条件。用集合论的术语来说，一个必要条件在多大程度上接近 
于充分条件，这可以表达为子集 Y 在多大程度上“包含”或填充父集 
X 。 在极限情况下，当集合 X 和集合 Y 完全相等时， X 便是 Y 的充分 
必要条件，其重要性也达到最大。 

请看一例，现在考虑这样一项发现，即地心引力和威权政体 （ au ¬ 
thor it arian regime ) 的存在是社会革命的必要条件（即如果不存在地心 
引力或威权政体 •一 个社会就不会经历社会革命）。在这两个必要条件 
中，威权政体这个因素 M 然更加 t 要。 然而 ，如何用集合论来表达这个 
事实呢？正如图 2.3 所示，我们可以做这样的展示，即拥有地心引力的 
个案集合包含所有社会的全部人群，因此，就必要条件来说•集合涵 
盖”集合 X 的程度达到最小（即不存在非一 X 的个案）。相比之下，拥 
有威权政体的个案集合却不是几乎全部人群。因此，集合 Y “包含”集 
合 X 的程度更大一些。如果推广这个观点，我们可以说，当存在多个 
必要条件时，出现频率较低的那些条件（即在相关的总体中是比较少 
见或异常的条件)就是比较重要的。 



Xu 有地心引力的 个案； 

入 1: 有威权政体的 个案； 

W 社会革命的个案。 

图 2.3 琐碎的必要条 件：一 个集合论例子 
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对充分条件(或者 i 者多因素组合后成为充分条件）的重要性的评 
估方式也类似。在这种条件下， X 是 y 的子集。当 x 对 Y 的涵盖度 
增加时，充分条件 X 将变得更加 重要； 也就是说，当子集 X 趋于与 Y 
有完美重叠时， X 就变得更加重要。因此， X 的重要性程度是变化 
的，它取决于结果的充分条件在多大程度上也接近于其必要条件。 
对于结果来说，非常 ® 要的充分条件就是那些接近必要条件的条件。 
一个完全不重要的允分条件是这样的，即如果其存在就会产生结果， 
但是该条件永远不存在•因此永远不会产生结果。如果推广这个观 
点，我们可以说，对于既定的一类结果来说，当区分出多个充分条件 
的时候，出现频率多的那些条件就是比较重要的。 

上文的民主式和平个案再一次提供了很好的阐释。如上所言. 
可以将民主式和平表述为“民主二方组和平的充分条件”。 ® 在这个 
假设下， X ( 民主二方组集合 ） 是 Y (和平二方组集合）的子集。 然而. 
这个子集的相对规模随时间而变。我们假定图2.心 I 描述了 1820年 
的情况。在那个时代，世界上只有儿个民主政体•因此只有很少的民 
主二方组。 x 集合（民主二方组）是和平二方组（即 y 集合）的一个小 
子集。如果推进到2000年•如图 2. 4 b 所示，世界上一半以上的国家 
现在是民主政体。这就意味着， X 作为 Y 的子集已经急剧增加，构成 
了 Y 集合的相当大一部分。就1820年的数据而言，似乎可以声称民 
主式的和平理论是真实的，但它又是相当微不足道的发现。然而在 
当代，我们就不能说民主式和平是微不足道的了，因为民主二方组构 
成了所有和平二方组的一个相当大的子集。 

全部和平二方组 



a 假设 1820 年的民主式和 平:琐 碎的充分条件 
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全部和 f -: •方组 



I) 假设2000年的民主式和平：®要的充分条件 

图 2.4 琐碎对重要的充分条件 ：民主 式和平 


2.7 结论 

本章是数学导引，笔者勾勒 r 逻辑学和集合论的一些基本原则 • 
因为它们与社会科学中的经验研究有关。我们的 m 标并不是简单地 
介绍逻辑学和集合论。相反，我们关注的来自逻辑学和集合论的观 
点都暗含地激活了定性研究领域。在此过程中，我们比较了逻辑学 - 
集合论与概率论-统汁学，开启了对两种传承的分析。我们已经看到 
在二者之间有很多 类比； 这些类比是有用的，同时 Oi 有误导性。它们 
一开始是有用的，但是当将它们看做 另一方 的完全对等物的时候•这 
种类比就具有 r 误导性。在逻辑学-集合论和概率论-统计学之间， 
存在一个转译问题。 

本章所讨论的初始对比将在后续章节中再次出现。最后，这两 
种传承之间的数学差异在所有的研究领域（从研究 F 1 标、闪果模型、 
概念和测量再到个案选择步骤）中都有广泛的分支。 

参考文献与推荐读物 

在哲学领域中有很多优秀的逻辑学导论性文献。对于社会科学 
家来说 ，可 采用一部经典教材，即科皮、科恩和麦克马洪 （ Copi，Cohen 
and McMahon, 2010 )。 其他优秀的著述包括豪斯曼、卡亨和蒂德曼 
(Hausman, Kahane and Tidman, 2010) ， 根斯勒 （ Gensler ， 2002) 和苏 
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佩斯 （ Suppo, 1999 )。 对模糊集进行全面数学介绍的著作是克利尔 
和袁 （Klir and Yuan ， 1995 )。 有关模糊集的开创性论文，亦可参见扎 
德 （ Zadeh， 1965 ) 。 本章讨论的许多观念都取材于拉金 （ Ragin, 
1987, 2000，2008 ); 也可参见施奈德和瓦格曼 (Schneider and Wage- 
mann ， forthcoming) 以及罗尔夫林 （Rohlfing, forthcoming) 0 至于在 

社会科学中利用逻辑学和集合论进行研究的成果文献目录，参见 
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一部只因渠編型与推断 





先因后果与先果后因 


原因 （ Cause ) :[中古英语，源自古法语，最终源自拉丁文动机 
( causa ); 理由；目的]名词， 1. a . —个效果、结果或结局的生产者； 
b . 为某个行动或结果承担责任者，如一个人 、一 个事件或一个条件。 

——《美国传统英语词典》 


3.1 导言 


让我们区分两种不同的询问和解决因果问题的方式。一种方式始 
于一个结果（即 Y )， 然后回溯其诸多原因（即多个 X); 第二种方式则反 
其向而行之•始于一个潜在的原因，然后追问其对 Y 的影响。前一种 
程序通常被称为“先果后因”路数 （ causes - of - effe〔、ts approach ) ，后者为 
“先因后果”路数 （ effects - of-causes approach )。 追问全球变暖的 原因， 
这是一个先果后因问题。探究炭排放对全球气温的影响就是一个先因 
后果问题。好的科学对这两种问题都关心。然而在社会科学中•沿着 
这两种研究路数会有重大的方法论后果，这里论的许多主题都是由 
这些差异引出的。 

在多大程度上以及通过哪些方式探究先因后果和先果后因问题, 
定 it 和定性传承有差别。定量学者作为一个群体，明显倾向于将先果 
后因路数作为社会科学研究的标准方法。特别是，他们一直喜欢在总 
体或样本内估计某些特殊变量的平均效应。在这个传统下，学者将受 
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控实验看做学术研究的黄金标准。在实验中，人们试图估计一种处理 
的平均效应。类似地，在针对观测数据的统计研究中，人们试图估计所 
关注的某个自变量的平均效应。虽然定量研究者偶而会通过解释掉的 
方差最大化(例如，较高的尺 2 )来解释 V %但这种做法在当代定量研究 
中已经式微。在我们的调查中（参见附录），只有6%的定量文章明确 
地讨论了统计量尺 2 。 

相比之下，在定性传承中，学者的兴趣点在于解释个案的结果，同 
时研究某些特殊要素在个案范围内的效应何在。这些学者通常始于在 
现实世界中发生的事件，并返回来询问其原因。与历史科学中（包括自 
然史、地质学和宇宙学）的其他学者类似，他们也提出先果后因模型，并 
用一些方法去确定过去发生的特殊事件的原因。理想地讲，诸多充分 
条件会带来结果，这些模型会确定这些条件(包括所有的重要条件）的 
组合。 

对一个先果后因问题的回答几乎总是需要一个多变量解释。对一 
些特殊个案的结果的因果分析涉及大量的要素。相比之下，在统计研 
究的平均效应路数 （average effect approach ) 下，就很容易并且通常只 

聚焦一个自变量。当然，在一种实验环境之外，研究者几乎总是需要在 
统计模型中加入其他“控制”变量来评估感兴趣的效应。但是，加入的 
这些其他变量是为了处理混淆原因问题，不是因为分析者的兴趣在于 
这些变量有效应或对所关注的结果有贡献。 

定性学者也考察个体原因所带来的结果，这或者作为一种先果后 
因路数的一部分，或者是为了自身的目的。然而，他们不会将对原因的 
效应的分析等同于平均因果效应分析。相反，他们要进行这样的因果 
分析，即对于特定个案中的特殊结果来说，要询问诸多要素是否为必要 
条件或组合后是不是充分条件。这样的话，当定性研究者考察原因之 
结果时，他们潜在或显在地用那些与集合论和逻辑学一致的方式来概 
念化那些结果。 

研究者在多大程度上对总体还是个案感兴趣，上述这些差异与此 
问题密切相关。根据定义，定量分析者几乎都集中关注总体分析，对个 
案不感兴趣。这自然促使他们依据应用于总体的平均值来考察原因的 
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结果。相比之下.尽管定性传统中的研究也涉及跨个案的推广，但是他 
们总是强烈地关注对个案的解释。这使得定性学者一点也不关注平均 
效应,却集中关注哪些原因带来了特殊个案中的结果。 


3.2 研究问题的类型 

某些问题具有这样的一般 形式: “什么引起了 Y ?” 定量和定性研究 
者都对解决此类问题感兴趣。然而，他们对这个问题的转译却不同。 
定量研究者用他们版本的先因后果路数 （ effects - of-causes approach ) 

来转译这个问题 :“在 由个案构成的一个总体中， X 对 Y 的平均效应是 
多少? ”这些学者很少将该问题转译为他们版本的先果后因路 数:“ 对于 
一个总体来说，有哪些 X 可以解释 Y ?” 相比之下，定性研究者通常用 
他们的先果后因路数来转译该 问题: “对于一个或多个特殊个案来说， 
哪些 x 可以解释 y ?” 定性研究者也可能用他们版本的先因后果路径 
来转译该问题 :“在 一个或多个个案中， X 引起 Y 了吗?” 

统计学方法论者认识到了先果后因与先果后因路数的差异。例 
如，统计学家霍兰论证道，在这两种路数之间存在一个“无法逾越的 
鸿 沟”： 


这两种路数都希望赋予短语 “ A 引起 B ” 以意义。（先果后因 
路径）通过将“八引起 B ” 解释为 “ A 是 B 的一个原因”。（先因后 
果）模型却将 “ A 引起 B ” 解释为 “ A 的结果是 B ”。( Holland , 
1986 ： 970) 

虽然霍兰的引文强凋了单个原因项，不过先果后因问题却使他们 
自己自然地设计岀一种旨在“充分地”说明结果的多变量解释。按照先 
果后因路数，人们则要从结果 Y 幵始，然后力图提出一个因果模型来 
确认能够解释 Y 的诸多条件。 


47 




两种 传承： 社会科学中的定性与定議研究 


尽管他们识别了这两种路数，当代定量研究者却坚持先因后果路 
数。正如莫顿和威廉斯 所言： 

政治科学的很多定量研究——我们可以说模型研究……聚焦 
于探索特殊个案的结果。有时候，所倡导的这种活动成为努力建 
立结果之原因的一般模型的一部分，但如果这样一个目标存在于 
研究者的头脑中，它通常就是隐含的 。 （ Morton and Williams . 
2010:35) 

例如，当定量研究者询问，“是什么引起了民主”,他们通常探求感兴趣 
的特定自变量的结果。他们会问•诸如经济发展 （Londregan and 
Poole ，1996) ，政党 （ Mainwaring ，1993) 和总统制 （ Cheibul )，2007) 等 

变量是否对民主有某种影响。这些研究的核心恰恰是探索发展、政党 
或总统制在一个总体中是否对民主有影响。 

作为定量研究基础的基本实验范式使这些分析者很难真正坚守先 
果后因传统。不重视先果后因研究是很自然的。例如，一些定量方法 
论者认为，先果后因研究只是“描述性的” （ Sohel ，1995) 或不能产生一 
般的因果知识 ( Beck ， 2006)。根据安格里斯特和皮施克 （Angrist and 
Pischke , 2009:5) 的观点，“不能用任何实验来回答的研究问题都是基 
本上不能确认的问题 ” （fundamentally unidentified questions . FUQ ) 0 
分析者指出•影响深远的 Neyman - Rubin-Hoi land 因果模型“是一个纯 
先因后果模型。至于我们如何从结果集合走向先果后因模型，该先因 
后果模型根本不关心 ” (Morton and Williams . 2010:99)。当统计学家 
戴维 ( Dawid ，2000) 提岀将先果后因路数作为一个特殊的因果性的吋 
候，他没有引起重视。在回应来自很多杰 出统汁 学家的一系列评论时 • 
他对自己提出的先因后果分析没有激起什么讨论表示吃惊。“我建议 
进行‘先果后因’推理。原本期望它最引起争议，我惊讶的是，目前的讨 
论与我的建议很少有关联 （ I ) awid ， 2000:446)。 

有人可能会问.统计研究者会怎样解决先果后因问题。在追寻“解 
释的目标时，一种途径是尽力使解释的方差最大。在早期的统计学 
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实践中，解释的方差（即令最大)是研究的一个主要目标，也是评价 
统计模®的关键标准。在这条路数中，如果模型的 f 接近于1.00,它 
就解释了 V。有来自儿十年前的许多统计学文章可作为例子，那时候 
研究者感兴趣的问题有：（1)每个X,解释 Y 的方差是多少•以及 （2) 整 
个模型解释 Y 的方差有多少。 

然而在政治科学和社会学领域，大约始于20世纪80年代中期，统 
计学者开始拒绝 “if 模型”，转而接受先因后果路数。领军的定量方法 
论者开始相当怀疑解释方差的目标 何在： 

如果你的目标是得到一个大的尺 2 ，那么你的目标就不同于回 
归分析设计的目标……最好的回归模型的 K 2 通常低于其他方式 
获得的尺 2 。 （生成）一个大的尺 2 的目标……和任何政治科学研究 
问题不大相关。 ( King , 1986:677;也参见 King ，1991) 

金和其他学者表明•将接近于因变量的某些变量(例如， Y 的滞后值)加 
人模型后，很容易使尺 2 增大。而且，寻找大的 R 2 值会鼓动加入许多 
自变童，并「1由于多种原因•这种做法可能是有问题的 (Achem 2005)。 
总之，现在很少有定量研究者用V统计量作为评估因果模型的基础。 
在目前发表的显示度高的著述中，尺 2 完全可能小于 (U0。 

还值得注意的是，在尝试或多或少综合地解释结果的过程中.早期 
的统计学者经常提岀定量的通径模型 (path models) (如 Blalock, 
1964)。这些学者利川诸如结构方程模型之类的技术，来设定位于一个 
序列中不同点的多个 自变量 如何共同作用才能产生所关注的结果 
(Bollen， 1989)。在社会科学之外的统汁分析工作中，虽然定量的通径 
模型仍然会偶尔被探讨（例如， Pearl， 2000； Morgan and Winship, 
2007)， 但是在社会科学的实际实践中，它们基本上已经被经验研究 
放弃。 

相比之下，定性研究者也提出因果论证，他们意在设定一些要素, 
这些要素组合起来作为充分条件会带来结果。例如，定性研究者试图 
确认第一次世界大战、东亚的异常发展、冷战的结朿、异常慷慨的福利 
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国家的产生以及新民粹主义政权 （ neopopu 1 ist regimes ) 上升等现象的 

原因。这种研究的核心目的是对研究范围内的每个个案的特殊结果都 
给出全面的解释（如 Levitsky and Way ， 2010 )。 

定性学者也研究并分析个体原因有哪些结果。他们这样分析 
的同时，通常也试图全面地解释一个结果。要想聚焦于解释 y (即 
分析一个结果有哪些原因），就需要展示各种 x 是如何带来因果效 
应的（即分析诸多原因有哪些结果）。有时候，定性研究者对某个特定 
的原因及其效应本身感兴趣。例如，科利尔和科利尔 (Collier and Col¬ 
lier, 1991 ) 的《塑造政界 》 （Shaping the Political Arena ) 就集中阐释 
了，在拉丁美洲，劳工整合期 （ labor incorporation periods) ’的种种变 
化如何影响到长期的政治动向。分析的主要目标是展示劳工整合 
期的各种异同点为什么对于解释个案 M 之间的主要政治异同点来说 
是根本。 

然而，当定性研究者用先因后果路数时，即使当他们向一个总体推 
广时，也不估计平均的因果效应。相反，他们通常会研究的是，可以将 
哪些条件带来的效应理解成在一个或多个个案中实际发生的某个结果 
的必要条件。因此，当定性研究者断言 X 对 Y 产生了一个因果效应的 
时候，他或她通常相信，如果 X 没有发生(或以另外的方式发生）， Y 就 
不会在所研究的特定个案中发生(或发生的方式不同）。 ® 例如，科利尔 
和科利尔 (Collier and Collier ， 1991 ) 的研究建立在如下观念之上，即不 


* 科利尔和科利尔的《塑造政界》 ( S / w / w 叩 //!r Political Arena )一书比较 J 8个拉美 
国家（阿根廷、巴西、智利、哥伦比亚、墨西哥、秘鲁、3拉圭和委内瑞拉 > 的政治系统在20世 
纪上半叶的形塑与发展。作者们展示了国家和政党是如何对有组织的工人阶级的兴起做 
出反位的•这种反应对于形塑政治联盟、政党系统的稳定或冲突的模式、政权及其变迁的 
轮廓都至关重要。本书关注这些国家如何控制和动员涌现出的劳工运动（不同的柠制和 
动员策略产生 了不同 的冲突和适应模式），探 i 、]* 国家在 槊造劳 T . 运动时的策略，解释不同 
渠道的国家政治变迁与长期的城币、商业和工业发展历史。本书是关于拉美政治领域的 
一部杰作。在书中•“整合” （ iiumpomtion ) —词的含义因国家不同而有别，“整合期 "（in 
corporation periods ) 在不同国家也不一样。作者们区分 f 四类广义类型的整合期（即四对 
国家）•每个整合期都有一个共同的 特征： 国家努力控制工会。——译者注 
«即国家。——译者注 

①当某个特定个案中的结果被多种充分条件过度地决定 r 的时候，这便是例外情 
况。在这种情况下•个体要素久在该特殊个案中可能不是 Y 的充分条件。 
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同类型的劳工整合期会遗留各自不同的独特遗产。尽管劳工整合期不 
完全决定政治后果，但对于在所研究的个体国家中实际发生的许多重 
要的政治动向来说，它们却是必要的组成部分。 


3.3 个案 

定性研究者受吸引去关注有关某些重要结果（如民主、战争、经济 
增长和制度变迁)之原因的一些普遍问题。同时，针对个案中的这些结 
果，他们也努力给出解释。那种先果后因路数导致他们给岀的解释同 
时适用于一组个案和该组内的每个个案。在定性传承中，提供令人信 
服的普遍解释的同时也对个案提供了令人信服的解释。 

因此,定性学者坚持以下基本 原则： 

对 Y 的一种好的普遍解释也是对 Y 中个案的一个好的解释。 

例如，为了给欧洲两次世界大战之间的社会民主一个好的定性解释.需 
要确认在瑞典、挪威和丹麦的社会民主的诸多原因。在吕 W 特 （ Liieb - 
bert , 1991) 的著名研究中，相同的一些要素（分裂的中产阶级、弱自由 
主义、社会主义者和农民党的联盟）可以在两次世界大战之间的欧洲引 
起普遍的社会民主，也在瑞典、挪威和丹麦这些特殊个案中引起社会民 
主。对某个结果的一般性解释如果不能很好地解释个案，那么该解释 
就不是一个好的一般性解释。再举另一个流行的例子，在历史上没有 
受制于殖民主义的农业国家中为什么出现社会革命，斯考切波 
( Skocpol , 1979) 提岀了一个解释。她的解释是一般性的，因为该解释 
意在应用于此(限定的）范围内的全部社会革命实例。同时，设计这种 
解释的目的也是为了充分地说明在其范围内的每一个实例，即法国、俄 
罗斯和中国。如果该解释不能阐明每一个个案中的社会革命，就不能 
认为它是一个成功的全面解释。 
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如此看来，定性学者需要确保其因果模型在其个案中也有效。他 
们希望确证，因果模型（在通常适度的范围内）可以解释所探究的全部 
(或几乎全部)个案中的 Y 。 这样的话，他们不会将评估一个显著的平 
均结果作为目标，但他们会努力给岀一个因果论证•使该论证儿乎总是 
可以解释其 y =] 的个案。 

相比之下，在定量的先因后果分析中，对个案及其原因进行集中研 
究至多扮演一种次要角色。为何如此？如果考察个体观测项在一个典 
型实验——如箸名的米尔格拉姆 （ Milgram , 1947 ) 顺从实验 中的 
位置，即可理解其原由。通过操纵实验条件(例如，与“老师”的距离远 
近），个体便被随机地分配到实验组和控制组。空间的接近如何影响顺 
从方面的权威人格，虽然实验可以告诉我们关于这方面的重要内容，但 
是•实验的设计并不是为了解释为什么任意一个特定的被试按照自己 
的方式行事。实验告诉我们的是一般意义上的结果，不会告诉我们某 
些特殊个体的结果有哪些原因。在一次实验中，甚至都不存在一种手 
段去争论个体个案，因为更大的研究社群可能都不了解个体的身份。 

同样，在定量研究中，关注点不是去解释任何一个个案。毋宁说， 
关注点是某个1'|变量在总体中的平均效应。这个平均值可能或不能应 
川于特殊个案。至于一个自变量是否会在某个特殊观测项上施加其通 
常的效应•这个问题不在考虑范围之内。人们可以不知道 X 在任何单 
独个案中如何影响却可以知道 X 在总体中对 y 的通常效应。 

原则上讲，人们可以在一个大样本 （ largcr-N) 先因后果分析中询 
问个体个 案:对 于处于实验组的个体/来说， X 有一个因果效应吗？然 
而，如果没有任何来自个案内部的信息•就很难回答这个实践问题。实 
际上，标准的统汁学路数有一个假定，即不可能估计个体/的因果效 
应，这恰恰是为什么要针对一个总体来估计平均因果效应（如 King, 
Keohane and Verba ， 1994) 的原因。 

的确，关于平均因果效应的信息可应用于个体观测。例如，医生会 
例行公事地基于大样本的实验和/或观测研究向个体提出建议。如果 
他们幵出了药方并且某些症状消失•就可能推断药物对病人个体产生 
了一个因果效应（当然.它也可能是安慰剂效应）。然而•如果不分析药 
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物影响症状的因果途径，这种推论就只是信息充分的猜测•很难是其他 
信息。 


3.4 结论： 互补性与混合方法研究 

是接受先果后因路数，还是先因后果路数，这在很大程度上要围绕 
着对比性的研究导向和目标来 决定: 是通过个案内分析来研究个案，还 
是通过个案间分析去考察总体中的集中趋势。定性学者用个案内分析 
来做出关于产生结果的特殊事件和进程的推断。个案内分析密切协 
作，在所研究的特定个案中，努力解说哪些因素会产生结果。相比之 
下，定量学者用个案间分析做岀关于总体的推断。在这里，人们自然会 
追问并回答这样的问题，即所关注的特殊变量在作为整体的总体内会 
产生哪些典型的效应。但是•要是论说某个变量对任何一个特殊个案 
有什么效应，这并不常见。 

每一种路数都能并且的确能够相互补充，这个事实表明了二者的 
功用。当定性研究者努力解释他们的特殊结果的时候，他们通常始于 
既存的知识，包括先前关于特殊原因的结果的统汁研究。与之类似，很 
多研究探讨的是在特殊个案中的结果有哪些原因，好的定量研究通常 
要考虑此类研究的结论。这些定性的发现应在统计分析中经受进一步 
的评估。 

如此看来，某些有力的理由让人相信定性与定量路数都是有价值 
的，并且可以互补。对于一个小样本中的某个结果来说，一个好的定性 
解释会促使人们考 量：如 果广义地理解范围，促成一个大样本分析（其 
目标不再是解释特殊个案，而更多是估计平均结果），那么同样的一些 
要素是否还起作用。同样地，当报告关于先因后果的定量结果时，自然 
会询问 :这些 结果是否可以从个案的历史角度来 理解； 人们希望尝试在 
特殊个案中锁定这些效应。这些类姻的互补性使混合方法的研究成为 
可能，并且它们指明 r 跨界的交流与合作的价值。 
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因果模型 


因果模型必然有不同的形式，这取决于用它们来做什么以及 
研究的是哪类系统。 

南希 • 卡特赖特 （Nancy Cartwright ) 


4.1 导言 

本章将比较两个模型。一个是加法的线性因果模型，它常见于 
统计学传 承中； 另一个是基于逻辑学的集合论因果模型，它常（隐含 
地)用于定性研究。在后续几章中，我们将探究一个或另一个因果模 
型的分支，因为它们暗设着关于因果性、因果不对称性、反事实等的 
不同观点。 

我们首先通过例子来介绍和展示这两种因果模型。接下来的 
几节将描述二者的实质区别。我们认为，虽然这两个因果模型有 
显著差异，但哪一个都没有先天的正确性。它们都可以潜在地用来 
解释社会和政治现象。然而，由于二者有别，在将它们结合或利用来 
自一种模型的洞见去推进另一模型的道路上，还是障碍重重。因此， 
我们建议，为了克服这些障碍，第一步就是领会二者各有什么独特 
之处。 
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4.2 两种因果模型 


在定性和定量研究中使用的标准因果模型很相似，只在一些不明 
显的方面有差异。为了说明这一点，现在考虑下面两个模型，它们分别 
在定量和定性范式中很 常见： 

Y =/3 o + 卢1 Xi + yiC \ + 72^*2 + … + e (4.1) 

( A 与 B 与非 r ) 或 ( A 与（’与 D 与 E ) 对 Y 来说是充分的 (4.2) 

方程 （4.1) 的典型体现包括像 OLS 回归这样最流行的一般模 
型，以及如双重差分回归 （ difference~in differences regression ) 这样正 
在流行的其他模型。方程的基本形式也包含对数线性模型 （ log - 
linear model ) 和多项式回归 (polynomial regression ) 0 虽然 logit 模型 

采用非线性函数，但它们在指数上是线性的。 logit 模型之所以经 
常被使用，是因为它们可以处理二分因变量，并不是因为分析者相 
信因果模式是非线性的。①分析顶尖杂志上发表的研究可以发现，在 
定量传统中建立因果模型时，方程 （4.1) 家族的某个成员是最常使 
用的。 

就我们的目的而言，方程 （4.1) 的一个关键特征是，研究者的兴趣 
点是估计义对 y 的效应（即斤）。除了与核心假设相关联的变量（即 
X ,)之外，该模型还包括几个控制变量或混淆变量(即 C ,)。 仅关注 X , 
和 Y 之间的一个显著的双变量效应义鲜有说 服力； 人们必须对这样一 
种关注点做出回应，即在控制变量 C 后，该效应可能消失。在方法论 
文献中，人们对方程 (4.1) 做出了大量的改进，但是在大多数利用定量 
方法的高显示度的实际研究中，这种基本的、加法线性函数形式仍然是 
常规的做法。 


①用来估计非线性模型的统计方法的确存在，例如卩!茨和沃茨 （Bates and Watts . 
1988)，但是在政治科学和社会学中通常不讲授这些模型。 
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如果转向定量方法论者之间关于最佳实践的争论，那么诸多子传 
承 (subculture) 之间的差异就变得明显。最值得注意的是，与一般线性 
模型相 比， Neyman-Rubin-Holland 模型或“潜在结果”架构 （“potential 
outcome” framework) 提岀了一种不同的统计研究路数，这种路数与理 
想化的随机实验有相当清楚的紧密联系（参见 Morgan and Winship ， 
2007)。这一架构的基础模 型是： 


因果效应— ^( x = o > (4.3) 

像方程 (4.1) 中的 Y —样，这个“因果效应”也是一个随机变量，人们通 
常检验的假设是 :该因 果效应显著地有别于0。这个架构比一般线性 
模型方法更加明确，后者的目标是估计 X 的平均因果效应。在这个基 
础模型中不需要控制变量，因为对处理的安排是在大量的观测中随机 
进行的。 

虽然潜在结果架构在统计学方法论者中间相当有影响，但它在研 
究实践中还没有得到广泛应用（见附录）。①关键原因在于，当从二分变 
量转向连续变量，并引人其他细微项（如交互项或中介变量等）的时候， 
该架构就变得相当复杂。不管怎样，许多方法论者还会坚持认为，定量 
范式的基本因果模型应该是方程(4.3)，而不是方程（4.1)，尽管后者主 
导着研究实践。 

在当代统计方法论者中间，贝叶斯方法 （Bayesian approaches ) 是 
另外一种重要的子传承。虽然贝叶斯分析法已经出现了几十年，但是 
从历史上讲，它并没有被大量地运用在社会科学研究中。然而，随着近 
年来计算能力的提升与马尔可夫链蒙特卡罗方法 （Markov Chain 
Monte Carlo methods ) 的提岀，该方法在应用分析中的主要障碍已经 
减少。在政治科学领域中，定量方法论者中间还存在着一种生机勃勃 
的贝叶斯子传承 （vibrant Bayesian subculture ) (例如，参见 Schrodt , 

2010给出的热情支持的观点）。这种子传承始于一组相当不同于方程 
(4.1) 的假定和原理（相关的精彩讨论，参见 Jackman ， 2009)。可能由 


①珀尔 (Pearl ， 2000 〉针对因果性提出了另一个有影响的概率论方法，该方法在研究 
实践中也没有重要影响。 
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于贝叶斯 f 传承与频次学派 ( frequentist approaches ) 差 异太大，因而 
不会(至少直接地)关心潜在结果架构 。① 

简而言之，在统计方法论学者中间有各种重要的小群体，他们内部 
争辩不休。然而，鉴于我们正尝试描述一些主导的研究实践，这些实践 
可以生产岀被大的学术共同体看成是社会科学中的最佳学术研究•因 
此，方程 (4. 1 ) 的基础模型显然最符合我们的目的。 

在定性范式方面，我们建议将方程 (4.2) 作为众多研究的基础。这 
项建议不是没有争论的，因为定性研究者通常没有系统性，也不写岀什 
么形式方程。然而,我们发现他们的论证经常隐含地采取一种与方程 
(4.2) 相类似的形式。在这里，集合论思想代替了加法模型的代数和统 
计学。 

前文用语言表述了模型，人们也可以用数理逻辑来表述模型。方 
程 (4.4) 的因果模型区分了生成某种结果的诸要素的两种组合，即这两 
种组合成为该结果的充分条件。这个模型使用了逻辑符号和布尔 
( Boolean ) 运算符。符号 A 代表着逻辑“与”， V 代表着逻辑“或”，”意 
味着逻辑“非”，一表示“充分 性”： 

(A A B A —' C ) V (A A C A D A £) — V (4.4) 

我们可以用集合论符号给出相同的方程，其中 n 表示交集， u 表示并 
集， C 表示集合 c 的补集， G 表示子集或对 等集： 

( An ^ nc ) U(Ancnon e)^y ( 4 . 5 ) 

正如方程 ( 4 . 4 ) 和方程 （ 4 . 5 ) 所表示的，这些因果模型看起来很不同于 
方程 (4.1) 的定量模型。然而，换一种方式写同样的方程，会让它看起 
来更像其对应的定量 模型： 

Y = (A * B ^ c ) + ( A * C * D *£) (4.6) 

当这样表达的时候，对集合论/逻辑模型的一个可能的反应便是声 


①例如，杰克曼 (J ackman , 2009 ) 的一本有影响的著作中并没有“潜在结果”这个索 
引条目，也几乎没有参考因果效应方面的思想。 
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称这是一种谈论交互项的方式。但是正如在两种语言之间的转译那 
样•逻辑“与”和统计模型中的乘法仅在局部上可比拟。如我们在“数学 
导引”一章所讨论的那样，还有相当多的差异是这种比拟所不能把 
握的。 

我们也可以用方程 (4.6) 将定性模型转译成统计学 术语： 

Y =/?i (A * B ^ c) +[]■>( A ^ C ' * D * E) 4~e (4.7) 

谁会在一篇研究文章中见过这样的模型？答案 是：没 有人。没有什么 
可以阻止统计软件去估计这样一个模型。然而.标准的统计学建议却 
提 供广很 好的理由去拒绝这种做法。例如，这甩没有截距项。要想估 
计方程(4.7)，需要假定截距是 L 而它可能就是我们要检验的假定，不 
能仅假定它就罢了。相比之下，“截距”概念在集合论/逻辑学范式中意 
义不大。 


4.3 集合论模型和个案内 分析： 一 种阐释 

大多数社会统计学者都在一门或多门统计学课程中学习过一般线 
性模型。然而，集合论的因果模型对于许多人(通常是那些隐含地使用 
它们的定性研究者）来说是不熟悉的。因此，考虑一下像方程 （4.5) 这 
样的式子在实践中采取什么形式是有帮助的。为了便于说明，我们考 
察布雷迪 (Brady ， 2010) 所分析的媒体提前宣布 ( early media call) 的影 
响:在 2000年的总统大选中•媒体提前宣布了阿尔 • 戈尔在佛罗里达 
州的胜利。这个例子会表明一个集合论模型是怎样隐含地用于对某个 
特定结果的个案内分析的。 

布雷迪的研究向洛特 （ Lou ，2000) 有影响力的结论提出了质疑， 
后者断言，在佛罗里达州的10个走廊县 (panhandle counties )， 乔治 • 
W . 布什至少丧失了 1万张选票。在这些县里，当大选投票还没有结束 
的时候•网络就过早宣布了阿尔 • 戈尔获胜。布雷迪声称，洛特不恰当 
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地使用了双重差分回归模型(参见 Angrist and Pischke , 2009)，做出丫 
错误的推断。 

布雷迪没有使用个案间统计方法论，而是利用个案内分析来估算 
丧失的选票数量。为什么媒体过早宣布会造成布什的选票丧失，否则 
他就会得到这些选票呢？布雷迪考察了其中必然存在的机制。需要特 
别指岀的是，布雷迪开展了一系列“箍筛检验 ” （hoop tests ) (有关这种 
检验的讨论，参见第7章），他在检验中区分岀一些充分条件，即哪些条 
件使得媒体提前宣布导致布什失去了佛罗里达居民的选票。 

布雷迪的箍筛检验指岀，布什要是丧失选民 f 的选票，选民必须同 
时是三个集合的成员。 f 先，必须是居住在佛罗里达州东部走廊县的 
居民 集合; 其次，没有投过票的合法选民 集合; 再次，听到了媒体声称阿 
尔 • 戈尔获胜的选民集合。用逻辑学术语讲，每个集合中的成员都足 
以使得该个体被编码成不给布什投票的潜在选民。如此看来，他（隐含 
地)使用了下面的集合论 方程： 

y =乙 n £ n h (4.8) 

在这个方 程中， 代表东部走廊县的 居民; E 是在媒体没有公布前投票 
的合格选民； H 选民听过媒体公布戈尔当选; Y 是由于早公布戈尔当 
选而使得布什最多可能丧失的选票数。这个方程说的是，可能改选者 
的集合是 L 、 E 和 H 三个集合的交集。该方程表示的是一种简单但 
有用的、计算最多可能出现的选票损失数的方法，即在这三个集合的交 
集中的成员总数。 

然后，在布雷迪的工作屮，一个关键的挑战是：如何沾算由处于所 
有这三个集合中的成员构成的总体的规模。他利用佛罗里达州的先前 
投票模式、媒体曝光和通常的投票行为知识，通过个案内分析来估算。 
根据布雷迪的佔算，“布什丧失的选票数上限约为224,……实际丧失 
的选票数大约在28至56票之间。洛特给出的1万票根本就讲+通” 
( Brady ， 2010:240)。 

这个简单的例子说明，在集合论因果模型和一般线性统计模型之 
间有三点关键差异： 
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(1) 无控制变量。例如，在双重差分设计中，针对佛罗里达的每个 
走廊县都有各种控制变量(亦称固定效应）。 

(2) 因变量不同。方程 (4.8) 给岀了最大可能的选票丧失估计量。 
正如我们在第2章所讨论的那样，在集合论中，最大(或最小)值经常在 
统计模型中扮演均值的角色。 

(3) 必要和充分条件。布雷迪的模型假定 T 一系列条件，其中的 
每一个都是可能丧失选票的充分条件。 

出于我们考虑的目的，问题并不是洛特的统计模型与布雷迪的集 
合论模型孰优孰劣，而是他们的工作完全不同，考虑不同的因变量，并 
产生不同类型的结果。 


4.4 因果关系的复杂性 

定量和定性研究者都假定•现实世界中的因果模式在某些方面 
确实是非常复杂的。他们同样也认为，对因果关系进行建模本身就 
是一件复杂的工作。然而，因果复杂性的形式因定量和定性范式而 
不同。 

在定量传承中，分析者要假定一个因变量总是存在着多个原因•这 
里体现了因果复杂性。例如，方程 （4.1) 就包含了许多自变量。此外， 
误差项（即 e ) 经常被解释为是部分由缺失的自变量构成的。在这个传 
统中，人们经常假定原因太多，以至于不可能全部找出来。 

虽然因变量的原因很多，但是定量研究的焦点经常是特定的一个 
自变量。例如•在方程 (4.1) 表示的因果模型中•关注点是其他自 
变量被看做“控制变量”，并且研究者对它们不足特别感兴趣。因果复 
杂性提出的挑战是.在已知其他变量存在的情况下，如何提岀一种好的 
佔汁量来估计感兴趣的变量的平均效应。这个挑战是令人苦恼的•因 
为某些其他原因会影响感兴趣的主要 U 变量和因变量（可引起潜在的 
虚假关系）•因此，需要将它们区分出来并加人到统汁模型中。吏一般 
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地说，我们需要控制变量以便产生因果的同质组。 ® 

相比之下，在定性范式中，因果复杂性体现在如下事实之中•即研 
究者建构的因果模式经常关注的是个案的组合 （ cmnbimtions ) 
( Ragin , 1987)。正如方程 (4.2) 所展示的那样，定性研究者常常要寻找 
能够产生结果(或作为其充分条件 ） 的一些因果程序包或配方 （causal 
packages or recipes ) 0 我们可以在方程 （4. 7 ) 中看到这一点，该方程用 
统计学术语重写了定性模型 ：各个 /?与因果程序包（而不是个别变量) 
有关。我们在布雷迪的例子中也可以看到这一点，在该例子里，三个集 
合的组合产生了丧失选票的最大可能值。 

在寻找因果配方的过程中，单个变量的角色经常被轻视，尤其是当 
单个变量不是必要条件的时候。“原因（：的平均效应是什么？”如果（: 
的角色在不同的因果构型中变化，那么该问题可能就意义不大。例如， 
在方程 ( 4 . 2 ) 中，(二有时有积极影响，有时有消极影响，这取决于与之相 
伴出现的其他原因项。同样， b 在和 a 共同出现以及在 r 不出现时就 
重要，但是 B 在其他情形下就对结果没有影响。因此，要想充分地设 
定/〗的效应•需要说明《岀现在什么情景(等其他原因项）中。 

现在，在拥有统计交互项的情形中也会出现同样之事。在方程 
(4.1) 中，我们呈现了最常见的统计模型•但是关于交互项的假设和模 
型不是不常见的（参见附 录）： 

Y - [3\X\ +/?iX 2 +/?3Xi * X 2 + C' + + …+ e 

(4.9) 

在这个模型中，在 X 2 的一定范围内， Xi 的效应可能为正，而在的 
另一个范围时. X ,的效应可能为负。定性和定量传承都赞同的是，当 
存在交互项时，构成交互项的单个变量的效应是多少，人们都所言 
甚少。 

然而，优秀的统计学家几乎从不估计如方程 (4.(5) 那样复杂的集合 
论模型。为了估计该方程•统计学实务建议在模咽中将低级项（如 A 、 
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AB、AC 和 AD) 加入模型之中。虽然这种做法有非常好的统计原因， 
但是这些原因在集合论模型中是不存在的。我们可以假想提岀一些统 
汁方法，用它们对定性模型中给出的各类因果构型进行建模。但是，这 
些统计模型，如布尔概率单位 （Boolean probit) 和布尔 logit ( Boolean 
logit) 方法 (Braumoeller，2003) 都在统计学主流之外。 

事实上，集合论模型的因果表达根本不是交互项。它们是特殊的 
因果组合。在方程 (4.6) 中，我们没有1 这类表达，但有一个涉 

及 A、B 及非(：（即 ( 0成员资格的特殊的因果关系组合。正是在这种 
特殊的 A、B 和 r 构型中的成员资格才是 Y 的充分条件。因此，在集 
合论模型中，逻辑操作“与” （AND) 将一些原因项加在一起成为一个 
•‘程序包”，或可称为“充分性组合” （sufficiency combinations)( 目的是 

突岀这样的想法，即该组合对于结果来说是充分的）。这激励人们更多 
地考量整个程序包，而不是其单个组成部分 (Ragin, 1987)。 

在诸如比较历史分析之类的定性领域中，因果论证通常涉及这些 
充分性组合。这样的话，斯考切波 （ Skocpol, 1979) 提岀，国家崩溃和 
农民起义组合在一'起，足以在一 ■个农业 - 官僚社会中造成社会革命;唐 
宁 (Downing ， 1992) 认为，中世纪的宪政与军事革命的缺乏也足以造成 
早期的民主;马奥尼 （ Mahoney , 2010 ) 也认为，少量本地人口和高度经 
济发展是西班牙殖民早期的美国 （early colonial Spanish America) 高 
度社会发展的充分条件。在某些情况下，一个因果组合中的个体因素 
位于不同的时间点。例如，在吕贝特 （ Luebbert ) 关于两次世界大战之 
间的欧洲政权的论证中，第一次世界大战前的软弱自由主义者和第一 
次世界大战后的红 - 绿联盟 （ red-green a 11 i ance ) 都是产生社会民主的因 
果程序包的一部分。 


4.5 殊途同归 


在定性和定量范式中使用的因果模型之间还有另一个差异，该差 
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异是围绕“殊途同归” （ equifinality)(George and Bennett , 2005) 或拉金 
( Ragin , 1987) 所谓的“多重因果性 ” (multiple causation ) 而生的。殊途 
同归指的是这样的观念，即有多重因果路数指向同一结果。在集合论 
的因果模型中，殊途同归可以用逻辑“或 ”（() R ) 来表示。例如，在方程 
(4.6) 中有两条因果路径 ABr 或 ACDE ; 其中任何一条对于达到结果 
来说都是充分的。值得注意的是，殊途同归并不要求有原因结合 
(causal conjunction ). 例如，下面的模型就表达了殊途同归而无须原 
因 结合： a v b v c — y 。 殊途同归的独特之处在于，多个条件或条 
件的组合[而不是如前文讨论的结合因果性 （conjunctual causation )] 
的存在能产生相同的结果。©在实践中，设计的定性因果模型所容纳的 
个案可以不在少数，通常既包含诸多原因项的结合，也包括殊途同归 
性，如方程 (4.6) 所示。 

殊途同归的存在对于定性因果模型来说不是独一无二的。在诸如 
方程 (4.1) 这样的统计模型背后隐含的观念是，达到一个特定结果的潜 
在路径有成千上万条。统计方程的右侧本质上代表的是一个加权总 
和，并且只要该加权总和大于设定的临界值(例如，在 logit 分析中），就 
可以预测结果会发生。运用这种殊途同归来解释方程 (4.1), 就有无穷 
多种方法可达到因变量的某个特殊值。殊途同归肯定存在。的确，殊 
途同归普遍存在，以至于我们谈论它儿乎没有什么意思了。 

在定性研究范式中，只有少数因果路数能达到一个特定的结果，这 
个事实才使得殊途同归性成为一个有用的概念。每一条路数通常都是 
诸多因素的一种特殊结合，但是其数量不会太多。在范围条件通常有 
限下的定性研究中(参见第16章），其目标是区分岀在总体中存在的全 
部因果路径。 

事实上，在定性研究中，分析者通常会尝试对所研究的全部个案进 
行分配，以便设定具体的因果路径。由于总的研究目标是解释个案•人 


①我们认为，关 t •殊途 n U 」的大部分 i 、] •论都认为其特殊之处在于表达 r 多因素的 
结合，这是不恰当的。如金、基欧汉和维巴 （King, Keohanc and Verba, 1994： 87 89) 那 

样，如果用一种统 i t •学的视角米電点关注这个方面•耶么殊途 N 归性尤非就坫一种讨论交 
互项的方式罢了。 
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们为此目标要区分出每个个案都遵循的因果路径。例如，希克斯等人 
(Hicks et al . , 1995) 的结论认为，有三个独立的路径刻意指向早期的 
福利国家•他们的分析可让我们确定到底有哪些个案遵循其中的每一 
条路径(也可参见 Esping - Andersen ， 1990)。在定性研究中，这些因果 
路径在一般理论知识方面可以扮演非常重要的组织角色。另引一例， 
穆尔 （ Moore , 1966 ) 的著名研究确认了三条指向现代世界的不同路径， 
每一条路径都通过诸多变量的某种特殊结合来界定，并且清楚地区分 
岀遵循每一条路径的特定国家。 

在定量研究中，根据基于自变量建立的通用因果构型来对个案分 
组•这种做法似乎也没有用。虽然人们可以做到一点，但它在该传统中 
不是惯常的做法。为了理解它为什么无用，有益的办法是 :用逻 辑学眼 
光来看统计方程 （4.1) 会像什么样子。在布尔代数 （Boolean algebra ) 
中 •“ + ” 号代表逻辑“或”，并暗示不同的原因或其组合，每一个都是结 
果的充分条件。因此，从逻辑学的观点来看•可以这样解读统计方程 

(4.1) ，即它暗示了每一个变量本身对于 Y 来说都是充分的。大多数研 
究荇都会认为这个命题是荒谬的，因为单个因素自身对于结果来说几 
乎从来不是充分的；只有因素的结合才是充分的。如此看来，正如方程 

(4.2) 那样转译统汁模遛是没有意义的一样•将代数-统计模型转译为 
逻辑学也有问题。 

事实上，统计方程 (4.1) 中的每一个变量都只是影响结果的众多潜 
在因素之一。现实是.整个模型就是该路径。关于这一点•有一个很好 
的展示来自多 _ 元方法研究 （multimethod work ) ，该研究首先检验一个 
统汁模型，然后川其结果来选择个案研究做深人分析（如 I . ieherman , 
2005)。在选杼个案时.人们可能选择在线上或线外(或两者都有）的观 
测点，这取决于研究 F 1 标。但是，对于整个总体来说线本身就是一个独 
特的因果路径。完整的因果模型适用于全部个案，并作为对所有个案 
的一类解释。 

在统计学传承中，从这种讨论中可引出关于使用殊途同归的一个 
关键结果。将统汁模型看成是假定了殊途同 U 1广泛存在，虽然在某种 
意义上讲这是正确的，但是在另一种意义上说就不对了。按照惯例来 
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理解，有了殊途同归性之后，人们将每一个个案分配给产生了结果的某 
种特殊原因配方 (particular causal recipe) 0 这种做法在定量传统中并 
不存在。在这里更可以从残差角度来理解个案，即它们在多大程度上 
靠近那条代表着作为一个整体的因果模型的线。这里没有殊途同归， 
因为作为一个整体的模型是对总体的解释。 


4.6 结论 

在两种传承中使用的标准因果模型非常不同，在很多方面难以比 
较。但是，从两种传承的对话观点来看，最好还是理解其差异而非一争 
高下。逻辑学和集合论构成了定性因果模型的基础，它们或多或少比 
作为定量模型基础的概率论和统计学更严格。定性方法强调指出，原 
因项取决于情境,并且作为整体共同起作用。对于这种研究来说，既然 
知道其典型因果模型暗示了有少数几条因果路径可达到结果，那么殊 
途同归就是一个有用的概念。任何结果都有大量的原因存在，这个事 
实让定量研究看到了因果复杂性。对于这种研究而言，殊途同归并不 
是一个有用的概念，因为其因果模型同时表明有大量的殊途同归，且仅 
有一条普遍的因果路径。 
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不对称性 


对于任何关系来说， . 对称性和不对称性之分都是它的 

( 一个）基本维度 • 尽管实际上大部分人对它完全没有感觉。 

斯坦利 • 利伯森 （Stanley Lieberson) 



导言 


定性和定量传承的一个核心 IX :別涉及它们分析对称或不对称关系 
的倾向。定量学者然重点关注有对称性质的又系，定性学者则趋于 
分析有不对称性质的关系。最终，一种关系是否对称，这是一个经验问 
题。然而.这两种传承的规范促使他们各自考站一种关系而不是另 

一种。 

W 果模型和解释可以在各种维度表现出不对称性。在本章 t 我 
们主要(尽管不完全)关注什么 " J * 能被称为“静态因果不对称性” (Static 
causal asymmetry ) 。®这个表达意味着对现象发 生的解 释并不足对其 


D 本也提及 W 果不耐称性 (causa I assen i et ry ) — i"j •它涉及这样的观念，即 • 1、变 
«的变动(比如从存变无)所产生的影响不等 fK 在其他 A 向1•.的变动带来的影响完令 
对称的因果效应是这样的•即不管 X 如何改变方向.它对 V 的效应都相同。我们可以从- 
种反事 实的方面来#待这种因果对称性因果关系在反杯的意义上可逆，它就是对称 
的义系如果 裝个给 定的入返回其初始 fft . X 对 Y 的影响会 iTT 人相 Xit 论 " f 参见利伯 
森 （I jel ) crson ，1985:第 .1 章: ) 
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未发生的解释的映像。当同一个模型既可以解释发生，也可以解释不 
发生的时候，就岀现了因果对称性。例如，在 logit 模型中，对成功的解 
释就是对失败的解释的否。实际上，鉴于对0和1的编码是随意的，因 
此，对调它们什么都不变。同样，对于全部的 y 值来说，我们完全可以 
使用相同的因果模型。相比之下，在因果不对称下，解释出现的模型和 
解释缺失的模型是不同的。我们不能针对所有的 Y 值用相同的模型。 


5.2 对称与不对称模型 

为简单起见，现考虑一个 2 X 2 表。如在第2章所见，对于 2 X 2 表 
来说， IL 乎所有的关联测度都是对称的。行或列调换不改变关联的性 
质。在统计学传承内部，这是一个正向 （ positive ) 特征。如果因二分变 
量的（可能随意地)编码变化而颠覆原有的发现，这是令人沮丧的。事 
实上，在统计传承中应用的因果性的反事实定义(参见第6章)恰恰意 
味着对 称性: 人们更感兴趣的是从0到1的变化，而不是相反。 

随着我们从 2 X 2 表转向连续变量，统计传承中的对称性通常被保 
留下来(实际研究中的确如此）。例如，在常规最小二乘法 （（) LS ) 回归 
中，人们在估计一个模型时需要假定因果效应是对称的。不管 X 的始 
点在哪里，也不管 x 的值是增加还是降低，在； C 上给定1个单位的变 
化都被理解为在 Y 上有相同的效应。用线性回归线很容易检视这一 
点。这条线假定一个完全对称的效应。在 logit 模型中. X 增加1个单 
位对 Y 概率的影响量将等同于下降一个单位的影响。同样，在潜在结 
果架构中 ， A - y , 项是对称的。 

相比之下，集合论模型通常假定不对称关系是围绕必要性和充分 
性建立的。例如，考虑这样一个关于必要条件的假设。当 x = o 的时 
候，该假设有一个精确的预言 :结果 应该不发生。正式地说，必要条件 
的缺失产生一个点预测： I J (V = 1/X =0) =0 o 与之形成鲜明对比的 
是•当 x = l 时，该必要条件模型却给出一个模糊的 说法： P(Y = 1 /X 
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= i )> o 。 必要条件(入 = i ) 的出现仅带来 y = i 出现的“可能性”。所 
有这些都意味着 y = i 出现的概率大于0。 

当考察 y 及其原因的时候，我们看到了相同的基本非对称性。 
一条必要原因的缺失本身足以解释 Y = o 的个案。相比之下，一条必 
要原因的出现仅能部分解释 Y = i 的个案。认知心理学中的研究表 
明，人们倾向于对的个案（而非 Y = i 的个案)给出单因素的必要 
条件解释。如此看来，当要求被试去解释失败或不发生的时候，他们更 
可能依靠单变量必要条件的解释。当要求被试去解释成功的时候，他 
们经常使用更复杂的多变量解释，这种解释可能不援引任何必要条件。 

在充分条件下，非对称性则有另类表现:1会产生一个精确 
的预言，而 x = o 却做出模糊的声称，即仅声明结果是可能的。①这1， 
一个充分条件的出现就能很好地解释任何1个案。相比之下， 
一个充分条件的缺失则在解释某个个案在 Y 的值上所言甚少。 

随着我们从二分变量转向连续编码的模糊集变量•这些同样的不 
对称原理仍然适用。例如，在一个必要的原因条件下，较小的 X 值可 
以很明确地预测 y 的值(即 y 将小于或等于 x )。 当 x =0这个最小值 
时. Y 必然恰好等于0。随着 X 值变大， Y 的取值域增加。当 X = 1 这 
个最大值时1可以取任何值并和假设一致。刻画必要条件的对角线 
是闱绕这种不对称性建立的 Y 深受较低的 X 值的限制，较高的 X 值 
却不如此。 


5.3 集合论模型的非对称性解释实例 

如利伯森 (Liebenson ， 1985:63) 所指出，“大多数经验研究都假定 
社会关系是不对称的”。对于定量传承来说•这当然为真，它也构成了 


①在社会科学中，很少有人认为笮个因素本身就足以带来一个正向结果。相反•人 
们将多个原因组合在一起才成为某个结果的充分条件。 
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社会科学中的大量经验研究。然而，在定性传承中，人们也发现很多非 
对称关系的例子。 

表 5. 1针对非对称关系给岀了一个简单易懂的展示 （ 至少对于学 
术界来说是如此）。这个表包含的是2009年一个一流社会学系的真实 
招生数据(参见 Vaisey , 2009)。集合论的解释是，得分高于定量 GRK 
分的中位数 (620) 就是入学的一个事实上的必要条件（只有一个例外）。 
这种必要条件的表述可以充分地解释所有得分低于均值的学生为什么 
不被录取。成绩低于定量 C ； RE 分的学生可以根据这个单一变量解释 
他们为何被拒绝。这当然不是故事的全部，因为（反事实地讲）即便假 
定这些学生中的大多数已经有很高成绩，也都会被拒绝。大多数人仍 
然缺乏一套能够被接受的充分条件。在这种意义上，他们的落榜是过 
度决定了的。不管怎样•较低的 GRK 数学成绩足以确定他们失败的 
命运。 

通过比较被接纳和被拒绝的学生•我们可以清楚地看到，定量的 
GRE 成绩并不能完全解释被录取。大多数成绩超过均值 

表 5.1 二分表中的不对称性 :某个一流社 会学系 20()9 年的招生项目 


接受 
拒绝 

资料来源:感谢斯蒂芬 • 韦西 （Stephen VaLscy) 分享这些数据。也可参见韦 
西 (Vaisey ， 2009) 0 

的学生仍然被拒绝 r ;在将成绩高于均值的考生分为被录取者和被拒 
绝者的 h 、 t 候，额外 的因素 在起着作用。 ® 

因此，人们吋 能询 问哪些因素促成了学生被录取。假定我们有一 
个简单却相当现实的情境 :影响 录取的因素有考试成绩 、 (;P A 、本科毕 
业学校的水平和推荐信。一个更现实的模型会增加儿个附加因素，如 


(;RE 分 

<620 >620 


] 

34 

98 

209 


1(、 


①当然.高于平均 GKK 定量分值之间的变异也可能对结果有影响。 
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论文性文章 (writing sample), 但是我们的观点可以用这四个因素来表 
达。利用这些变量，得到关于录取的 logit 模 型是： y=/?n+^,T+/? 2 G 
+ + 丄 + e ( T : 考试成绩, G : GPA , C / : 本科毕业院校水平， L : 推 

荐信）。一个可选择的集合论模 型是： 这个模型 
给出广如下对失败的 解释： ~^ Y =—^ T+—^G + (—^U * —' L ) 0 因此， 
导致失败的因素可能是低分或低水平学校或本科学校低质量和印象不 
深刻的推荐信的组合。 

就 logit 模型来说，应注意其中如何有一种关于成功和失败的单因 
素解 释:原 因项的加权总和或者足够高，以至于跨越某个成功的门槛, 
或者太低而导致失败。®整个模型即涉及将0个案和1个案进行比较。 
我们不能设想针对 Y = 1 和 Y = 0 分别写岀 logit 模型。©相比之下，在 

集合论研究中.关于成功和失败的解释(尽管相关并使用相同的因素) 
却有不同的形式。有两条通向成功的路径 （ B 卩了*或 
厂），而通向失败的路径却有三条（即1了， iG ， 为求 
成功，至少需要考虑三个因素，而一个因素通常就足以导致失败。这看 
上去与实际录取程序一 致：为 了迅速淘汰掉大多数申请者，委员会成员 
要寻找致命的缺陷，然而他们要考虑一系列因素并仔细审阅才能确定 
成功者的申请者。 

这个简单的例子提请我们注意基于逻辑学的模型有一个重要 性质： 

解释的不对称性。对失败的解释通常不同于对成功的解释。 

一个失败结果的原因未必等价于成功结果的原因的缺失或否定。 
事实上，在使用形式布尔方法的定性研究——如定性比较分析 ( QCA ) 


① 也可以违立二分变量的 logit 模型，其中只有少数几条路径可带来成功，导致失败 
的路径的数目不同于导致成功的路径数[感谢撒德 • 邓宁 （Thad IXrnning ) 指出这一点]。 
显然， / I •: 一个 logit 模型中■能带来成功的路径数将取决亍变量和参数估 il •的性质。然 
而 •当 利用不带极端值的连续变量的时候(通常还真这样做）•将存在多条通向成功的路径。 

② 的确存在前设不对称性的统汁模喂。例如，4尔科夫转换矩阵 （Markov 
transition matrices ) 不假定从状态/转到状态 j 的概率等于反向的槪申。 
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中，研究者对于成功和失败的个案通常得出相当不同的最终模型 
( Ragin , 2000)。下面的三例说明了这 一点： 


1. 威 克姆-克劳利 （ Wickham - Crowley ，1992) 探索了拉丁美 
洲成功的革命游击运动的原因。他的布尔分析表明存在如下五个 
条件，其中每一个单独都是社会革命成功的必要条件，合起来则是 
其充分条件 ：（ A ) 游击战 尝试； （ B ) 农民的 支持； （ C ) 强大的游 击队; 
( D ) 世袭的禁卫军 制度； （ E ) 失去美国的支持。因此 ，他给 出的成 
功因果模 型是： 


成功的社会革命=/^^7)£ 

相比之下，威克姆-克劳利对失败的革命游击运动的解释是非常不 
同的： 


社会革命的失败 =ABcJ + bee + bcD 

这种非对称性是显而易见的 ：通向 成功的路径只有一条，它含有五 
个要素，而导致失败的路径却有三条，且每一条都包含三个因素。 
值得注意的是，某些个体因素的因果效应大大依赖于情境（即与它 
们相结合的其他因素）。例如，原因项 （ causal factor ) B ( 农民支持 
游击队）对社会革命而言是必要的，而当游击队进攻的是一个非世 
袭禁卫军政权时，它却有助于防止社会革命的发生。我们也可以 
用下列方式思考这些方程的非对 称性: A / W 的确足以确保不发生 
社会革命，然而反之却不成立。也就是说，否定这些因素也不会促 
成一场社会革命。 

2. 斯托克 （ Stokke ，2007) 考察了哪些因素可以导致当事者遵 
循国际渔业体制。他给出五个原因项 ：（ A ) 建议-来自体制内 
科学咨询机构的明确建议 〆 C ) 承诺——制度受众的行为明确违 

反了保护性措施； （ S ) 预期考量 （shadow of the future ) -制度受 

众在现行体制下追求新交易的感知性 需求； （ I )不便之处——制度 
受众的行为不便于改变 “ R ) 反响——受众冒着因不服从而受诽 
谤的风险。斯托克给出的最终成功模型 如下： 
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成功 =Ai + ARS 

因此，通往成功的路径有两条，明确的科学建议 （ A ) —般是成功遵 
循国际渔业体制的必要条件。人们可以运行斯托克的数据并生成 
一个失败（即非成功） 模型： 


失败 =sl + Ir 

此外，失败方程并不筒单地是对成功方程的 否定； 这些方程不是对 
称的。例如，在成功方程中，“建议”因素是一个必要条件，但它始 
终没有出现在失败方程中。 

3. 马奥尼 （ Mahoney , 2010) 认为，西班牙殖民主义的变化可 
以解释拉丁美洲诸国之间的经济长期发展水平的差异。在最聚合 
的层次上，他的解释强调了三种原因项 ：（ M ) 重商主义的殖民中 
心——国家深受西班牙哈布斯堡王朝（ Habsburg Spain ) (1500— 
]700) 的 统治； （ U 自由殖民中心——国家深受西班牙波旁王朝 
(1700 — 1821) 的 统治； （ W ) 福利——国家在后殖民时期经历了代 
价高昂的战争。他的综合发现可归纳 如下： 

高度经济发展 =rnL + mlw 
中度经济发展 =ML 
低度经济发展 

显然，这些解释之间不存在完美的对称。通往高度经济发展的路 
径有两条：（1) 一个国家在重商主义哈布斯堡王朝的殖民主义阶段 
处于边缘地域，而在自由主义波旁王朝时期处于核心 地区； （2) — 
个国家可能在这两个时期都处于边缘地域，随后在后殖民主义时 
期避免了代价高昂的战争。通向中度经济发展的路径只有一条， 
即国家在重商和自由主义阶段都处于殖民的中心。对于这条路径 
来说，代价高昂的后殖民战争是否发生却无关紧要。最后，达至低 
水平经济发展的路径同样有两条：（1)国家在重商主义哈布斯堡王 
朝时期处于核心地区，在自由主义波旁王朝阶段处于边缘 地域; 
(2) 国家在这两个时期都处于边缘地域，之后在后殖民主义时期经 
历了高代价的战争。 
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最后，为了说明寻求非对称关系有什么潜在价值4上我们考虑霍华 
德和勒斯勒尔 （Howard and Roesslcr , 2006) 的获奖文章，“竞争性威权 
政权下的自由选举结果”。 ® 因变量是政权的自由化程度.未必是民主 
化，但是朝此方向运动。我们和他们都关注的关键自变量是“反对者联 
盟”。这意味着，反对政府执政的団体和政党在即将到来的选举 中已经 
形成 r 一个联盟(分析申.位是选举）。表 5.2 再现了他们的统计结果。 

表 5.2 的统计发现清楚地显示了反对者联盟变量的强烈影响。这 
可以说是表中最强的一对关系•也基本上是霍华德和勒斯勒尔最中意 
的一个变量。同样真实的是，该变量同时解释了成功与失 败:缺 席与失 
败相关，在场与成功相伴。就本章的内容来说，我们可以追问，反对者 
联盟变量在解释结果的时候是否不对称。换言之，反对者联盟存在的 
影响与其不存在的影响是否不同？ 


表 5.2 —个对称的统计模 型：对 自由选举结果的解释 




反对者联盟 

7.8“ (3.0) 

反对者动员 

0.91- C0.4) 

推翻当政者 

3.2, (1.5) 

经济增长 

0.3(0.2) 

对外直接投资 

一 0.1(0.3) 

对外援助 

0.01(0.02) 

议会制 

~3.3(2.2) 

政权的开放度 

1.0(1.0) 

先前的自由式变革 

-1.4(1.7) 

常量 

— 1.3( 5.2) 

总数 N 

50 


注:括号内为标准误 u 

资料来源 ： Howard and Roessler, 2006:375 。 


①感谢朱斯滕 • 施耐德 (Osten SdmdderV/f 我找到这个例 f • 允汁 • 我们使川它 ,, 
参虬施耐德 ( Schneider ，2007) 对这些数据的充分 flf 分析。 
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5 不对称性 


通常情 况下. 所有读者都知道统计结果表（即表 5. 2 ) 中蕴涵的内 
容。为了探讨其中是否存在因果不对称性，一种做法是做一个全面的 
定性比较分析 ( QCA ) (参见 Schneider ， 2007)。然而，为求简单，现考 
察一个 2 X 2 表（参见表5.3)。正如我们在第2章中所见，通过集合论 
来考察数据所导致的解释可能不同于依据统计分析给岀的解释。 

一方面，很容易看出为什么人们可能认为这个表是有关因果对称 
性的一个很好例证 1) 的反对者联盟个案引起了自由化，82% 
(32/39) 的非反对者联盟个案 导向 了非自 由化。 因此，反对者联盟是否 
存在似乎能以一种相当对称的方式来预测是否自由化。 

另一方面，如果透过定性视角来看，我们的注意力就转向那些几乎 
空的格。这种看待数据的方式唤起我们关注潜在的不对称性。纵观各 
行，我们发现反对者联盟的缺失近似成为自由化缺失的一个必要条件， 
即91%(32/35)的非自由化个案也缺少反对者联盟。这表明，反对者 
的缺失在解释失败时至关重要。 ® 


表 5.3 统计分析与不对称因 果:对 自由选举结果的解释 


LKO 

0 


注： LE () 表 ? K 自由选举的结 iH *( liberalizing electoral outcome ) 。 

资料来源： Schneider , 2007„ 

在实现自由化的诸多个案中•近5 0 % ( 7 /15 ) 设法在没有反对者联 
盟的情况下获取成功。因此，反对者联盟的存在对成功而言不再是必 
要条件，也不再接近于是充分条件。看起来，存在着多条实现白由化的 
途径，其中都不包括反对者联盟的存在，但是，通往失败之途却几乎总 
是包含着反对者联盟的缺失。因此，我们对这些数据的稍加分析遵循 
着与社会学招生数据同样的形式。我们有一个变量在解释失败时比解 


①一个更深人的分析将探讨它在何种程度 L 是一个不足道的必要条件或具有低拟 
盖度 （Goertz， 2006 ； Ragin, 2008)。 


反对者联盟 


0 1 


7 

8 

32 

3 
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释成功更重要。 

显然，这个例子仅仅是说明性的。我们还没有考察控制变量和其 
他可能导致一个不同解释的因素。关键在于，被认为是数据的最重要 
的那些特征可能变化极大，这取决于人们调换到对称模式还是不对称 
模式。虽然数据本身不变，但得岀的推断却取决于人们的视角。 


5.4 结论 

居于两种传承核心的基本因果模型在对称性问题上存在分歧。集 
合论模型处理的是不对称关系。他们假定不同的 x 值会对 y 产生不 
同的效应。同样，他们通常针对不同的/值(如成功与失败）给出不同 
的解释。相比之下，统计模型(恰如在实际研究中的应用那样)通常是 
对称的。线性回归模型假定不管 x 的起点值怎样， x 的一个给定单位 
的变化都将对 Y 产生同样的影响。在 logit 模型中，不管因变量的值由 
0变成1还是反之，都会产生同样的参数估计值，除非正负号改变。由 
此，解释不发生是解释发生的映像。 

我们并不主张一种路数优于另一种。最终而言，对称性与不对称 
性的存在取决于数据和有待检验的因果模型。然而，我们的确相信，这 
种差异是为何难以比较定性和定量因果模型的关键原因。很难将标准 
统计模型的基本对称性转译为集合论模型的基本不对称性。类似地， 
也难以用标准的、对称的统计学工具来把握集合论模型的不对称性。 

参考文献与推荐读物 

方法论文献通常不考虑统计模型的静态因果对称性，尽管偶尔有深 
入考察(例如， Abbott ， 2001: 第1章）。对定性比较分析的标准的讨论强 
调，作为方法论的一个常规部分，人们需要分别估计成功模型 （y = i ) 
和失败模型 （Y = 0) ( 例如， Ragin ， 2000，2008; Schneider and Wager - 

nann ， forthcoming ) 0 关于对统计模型的动态因果对称性的讨论和批 
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休谟对原因的两种界定 



有之，显“ 效”； 无之，“效 ”散； 无以名“ 之”； 唯曰“要因”。 

-伽利略 


大多数原因都可以更准确地被认为是••充分非必要条件的必 
要非充分部分 ”(INUS conditions )。 

- 威廉 • 沙迪什 （William R. Shad is h) 

托马斯 • 库克 （Thomas D . Cook ) 
唐纳德 • 坎贝尔 （Donald T . Campbell ) 


6.1 导言 

定 M 和定性传承中的因果关系竹不同的研究路数 u 来〔 I 大卫•休 
漠的一段著名引文为我们提供丫讨论这些路数的一种饤效的方 式： 

我们可以将原因定义为一个物象随后的另一个物象，在这里 
我们可以说.凡是和后者相似的一切物象都必然伴随着和前者相 
似的物象（定义1)。或者，换言之，如果第一个物象不存在•第二 
个物象将永远不会存在（定义2)。（大卫 • 休谟： 《人类理解和道 
德原则研究》） 




两种 传承： 社会科学中的定性与定量研究 


正如许多哲学家所建议的那样，休谟的短语“换言之”是有问题的。 
该短语使得定义1与定义2好像是等价的，而事实上它们代表完全不 
同的路数。刘易斯写道，“休谟的‘换言之’……不仅仅是重述了他的第 
一个定义。它们提出了完全不同的 东西： 对原因的一种反事实分析” 
( Lewis ，1986 a : 160) 0 

遵循刘易斯的分析，我们可以称休谟的定义2为“反事实的定义”。 
相比之下，为了突岀休谟的观念，即原因后面总是紧随着结果，我们应 
该称定义1为“恒随定义 ” （constant conjunction definition ) 。①在本章 

中，我们思考在定量和定性研究传统中，这两种定义是如何与对因果关 
系的理解相关的。 

需要强调的是，我们在运用休谟的理念的时候，仅将它作为一个手 
段，用它来探讨“原因”概念可通过哪些不同的方式用于定量和定性传 
承中。我们关注的是，在哲学中对原因的潜在理解能有助于推动两种 
范式的发展。还值得注意的是，我们的理解不应归因于休谟本人。休 
谟关于因果性的观点已经成为哲学家之间大量争论的来源，我们也不 
声称去解决这些争论。 


6.2 定量传统 

在潜在结果架构 （potential outcome framework ) 兴起之前（参见 
Morgan and Winship , 2007) 就有对因果关系的统计学讨论，这种讨论 
关注的是在一种概率论架构下的休谟的恒随定义（定义1)。例如，苏 
佩斯在其早期的著名分析中写道 :“粗 略地说，我对休谟的分析提岀如 
下修正，即如果第一个事件岀现之后，伴随而来的第二个事件岀现的概 


①这种因果观支撑了 20世纪中期社会科学中形成的覆盖律模型 （the covering law 
model ) 0 例 如:“ [一个覆盖的、科学的 （ Hempel ，1965)] 定律有如下形式‘如果存在条件 
C !， C 2 , …，（^，就总有£，”(乱咖1% 1999:5)。 
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率很高， WU 第一个事件是第二个事件的原因。” ( Suppes ， 1970： 10) ①在 
这种概率论的路数中，似乎自然地基于关联性来理解恒随定 义 ： X = 1 
与 Y = 1 有关。 

针对休谟的反事实定义（定义2)_我们也可以提出一种统计学解 
释。然而•这需要某些准备工作，因为休谟的反事实定义暗指单个个 
案。定义1陈述的是“所有对象(复数)后面都紧随……”，与之不同，定 
义2阐述的是“如果第一个物像(单数)不存在……”因此•在一个恒随 
方式中来理解定义2•就要求将休谟的观念扩展到多个个案中。 

定量传统从跨个案的恒随性 (constant conjunction ) 的角度解释定 
义1和定义2,由此实现了这一扩展。相关系数为 1.0() 意味着 X = 
V =1 和 X =0, Y =0 之间具有一种恒随性。因此，可以将定义1和定 
义2融合成一个统计解释。定义1认为，当原因存在时，结果将（在 
概率意义上）存在。定义2认为，当原因不存在时，结果将（在概率意 
义上）不存在。由于仅仅考察1而缺少 0( 反之亦然）的个 
案是没有统计意义的，这两种定义便统合成了一个。二者都不能单 
独存在并具备统计意义。但当它们融合成一体，便提供了一个对因 
果性的连贯对称性的理解，其中的重点是分析在自变量取不同值时 
结局如何。 

目前，在政治科学和社会学的方法论者 中间. 探讨因果关系时的一 
个主要观点就是潜在结果架构。也许它在统计学界的最重要创新是强 
调因果关系的反事实基础。例如•摩根和温希普 (2007) 的杰出综述名 
为《反事实和因果推断》 ( Counterfactuals and ( 'ausal / nferem e ) 。早 

期的统计学和概率论解释都被认为忽视或低估 r 因果关系的这一電要 
方面。 

Neyman - Ruhin-Holland 模型处于该路数的核心，该模型首先始于 
个案，然后建构一个成熟的因果关系统计模型。该模型运用基本的实 
验设汁，对个体 i 进行实验处理。反事实就是 ：如果 接受了控制后会 


①显然•苏佩斯的解释比较复杂 H 尤其是当处现观测数据时•（与处邱实验数据相 
反)人们必须关注虚假关系等。 
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发生什么。山于个体不能同吋既接受处理乂受到控制，两种" I 能之一 
必然总是一个反事实。这一实情引出了一个基本问题： 

因果推断基本问题。不可能在同一单位中观测到和 y .. 

( / ) 的值 ( / =处理 ， r =控制），所以.不可能观测到/对/的影响 。 

( Holland , 1986: 947) 

由于用统汁 M 来估计或 if 佔因果效应耑要苻相对大 M 的实际数 
ft ;， 统计学家 M 多能做到的就是估汁平均 W 果效应 （average causal 
cffeel ) ，或者使川比较流行的术语即样本中的平均处理效应 （Average 
treatment Effect , ATE ) 0 

重要的是，统计的解用 / 在整个单位总体上可 以估计 的平均 

因果效应代替了 /在具体单位上不可能观测到的因果效应。 

( Holland ， 1986：947) 

将获得的 f 均处理 效成 ( 八 TI - : ) 作为 W 采关系反事实 i : l l ! 论的基础 • 
这便完成广土猜传承中我们所谓的“因果推断循环 ” （causal inference 
circle ) (类似于解释学循 环）： 

1. 人们始于休谟的定义2,它强调针对 被试/ 的反事实。 

2 .运用代数和统计量来解释定义 •.反 事实是处理和控制之差 • 
Y , U )~ Y t (/)( Holland , 1986:947)。 

3. 人们川恒随形式的定义 I 来分别进行处观和控制•即分別针对 
X =1和 X =0进行处理和控制。 

4. 在所有的个案中•计算岀处理和控制之间的平均差，即 f 均处 
理效应 ( ATK )。 

5. 平均处理效应便为被试/提供了个休个案的反事实。 

在这-循环屮•休 漠的怊 随定义1是举足轻重的•尽管其出发点是 
他的反事实定义2。反事实的出发点增加 f 解决问题的不 " J * 能性。其 
结果是.学荇必须迅速转向定义 U 并将恒随 觇念既 用 在处现 • lii 用于 
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控制•从而取得进展。然而,其结果是这种架构在估计因果效应的实践 
中遵循了先前的统计路数•即将反事实的定义2还原到恒随定义1。 


6.3 定性传统 

从定性传统的视角看待事物，就可以从逻辑学方面来理解休漠的 
定义。哲学家和定性方法论者关注恒随定义的逻辑形式 :“若 x - i , 
则 Y = l 。” 将“如果……那么”分句作为一条逻辑陈述来理解，定义1就 
将“原因”看成是 X 与 Y 之间的一种充分性的关系。这一充分性解释 
关注的是的情况(即那些存在着原因的个案）。研究者从存在的 
原因出发，然后考量它是否有相应的效应。在此意义上.对定义1的定 
性解释与定量解释类似。 

然而.在这一点上，两种传统分道扬镳。定性解释不会做出进一步 
推断，即认为休漠的恒随定义暗含着 x =() 与 y = o 的个案之间有相关 
性。相反,这种观点认为，如果原因不存在•其结果可能存在或不存在。 
定性解释将定义1作为一个关于充分性的声称，这一充分性可以被独 
立研究。因此•虽然统计学解释将定义1和定义2融合起来，但与之不 
同，对定义1的充分性解释完全自行成立且可能是有效的，即独立于当 
使用定义2时得到的结论。 

两种传统之间在定义1上的另一个重要差异涉及这一事实，即 
效应很少总是由个体的诸多原因带来的（至少在社会科学中是如 
此）。正如我们在上文看到的，定量方法罕•已用概率论假定解决了这 
一 问题。虽然这些假定有时也被纳入定性研究中，但是另一标准的 
解是将因果充分性与“多重的、联合的”因果关系连接起来 （ Ihgin ， 
1987)。正如在第4章“因果模型”中所讨论的，定性研究者将因果关系 
视作组合性的或“联合的”，其意义是说.几种不同的原闪必须组合起来 
(如1 才能产生一个结果。至于个体原因（如 X ,)本身不 

足以带来结果。 
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同时，定性研究者将因果充分性视作具有潜在的“多重性”，即通常 
存在着多因素的“不同组合”，每一个组合对结果来说都是充分的。这 
便是一般的殊途同归原则：没有任何单个原因序列 （package of causes) 
可以产生所有 Y=1 的结果。不同的原因序列会导致同样的结果。在 
定义1的情境下，这一理念是至关重 要的； 它暗指的含义是，在给定的 
一 个充分性序列上的零值并不意味着7 = 0,因为其他因果序列可能会 
产生 Y = 1 的结果。 

这种基于逻辑学的路数生成了自己的推理链条，它始于休谟的定 
义1，达至 个案： 

1. 始于休谟的定义1，它强调恒随性。 

2. 对该定义的解释意味着久=1对于 Y = l 来说是充分的。 

3. 将X视为是由一序列原因项组成的，如X, * X 2 * X 3 。 

4. 推而广之，认为所有原因系列X! *X 2 之后都“跟随着” 

1。 

5. 如果个案/包含 Xi ^ ，那么这一序列就被理解为是 

Y= 1的原因。① 

因此，我们结束于关于个案；的因果陈述，就像我们之前针对统汁 
因果推断循环所做的一样。尽管二者有这种相似性，但是在推理过程 
中使用的步骤是截然不同的，而最终对于/的因果断言的本质也明显 
不同。统计路数同时使用定义1和定义2,而这种版本的定性路数只 
使用定义1。 

也可以从逻辑的角度来看待休谟的反事实定义2。在哲学界，因 
果关系的反事实方面一直受关注。可以说，哲学界近几十年来对因果 
关系的最有影响力的解释来自戴维 • 刘易斯。他的专著《反事实》 
( C ( )_ erfactirnls)m 先于 1973年岀版，早于统计学中对反事实的重新 
发现。与休谟的定义2相一致的是，刘易斯根据个体个案提出了他的 
反事实 定义： 


①最后关于/的推理要假定第四步中的推广是有效的。我们先前假定存在着显著 
的平均处理效应，这两种假定类似。 
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我的分析意味着要应用于特定个案中的因果关系。它不是对 

因果一般性的分析。 ( Lewis ，1986 a ： 161— 162) 

如果特定事件 f 不发生，事件 e 就不会 发生； 当且仅当此时， 

才称事件^因果地依赖于事件 （ Lewis ，1986 a ：242) 

统 ft •学以外的其他著作也强调了个体个案中的因果关系，包括马克 
斯 • 韦伯对反事实的著名分析 ( Weber ， 1949)，哈特和奥诺雷 （Han and 
Honore , 1985) 对法律中因果关系的分析。当关注点是个体事件时•反 
事实的解释便是自然而然的选择(包括在潜在结果架构中亦如此)。 

大多数有关反事实的哲学文献仍然维持在单个个案层次，但社会 
科学的核心目标在于普遍解释，因此，如何用因果规律性 （causal regu - 
larities ) 来改写定义2.这是社会科学家特别感兴趣的课题。在定性传 
统中，关键的进展是用一个必要条件来解释反事实。因此，人们可以利 
用逻辑学，根据下列方式重述定义2:如果 iX ,， 则这似乎是完 
全自然的，因为休谟说:“如果第一个物象未曾存在。”如果关注点又回 
到众多个案和一般模式，在此意义上，有关必要原因的假设将我们带回 
到休谟的恒随定义1。 

定性研究者将反事实进行推广，推广的过程启示了另一个始于定 
义2的因果推论 循环： 

1. 始于休谟的定义2,它强调的是反事实。 

2. 从逻辑角度来理解这一定义 •.如 果 X 没有发生过， Y 也不会发 
生，即如果一 1 x ,， 那么 

3. 将个别个案的反事实推广到所有个案。即对于所有的/来说， 
如果那么一① 

4. 运用定义1，将这种反事实转换为关于一个必要原因的普遍表 
述，即 X 对于 Y 来说是必要的。 

5. 如果 x 在情况/中存在，那么 x 是 y 的一个原因。 


①当然，“如果— * X ,， 那么一 ny ,” 与“如果1，那么久=1”是等价的。但是，这 
一表述逆转 丫反事 实版本的因果方向。虽然如此，“如果7= 1•那么 X = 1 ” 的表述对于 
经验检验而言仍然是重要的，因为人们往往用这种表述来选择个案(参见第14章） 
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在这一循环中，关键的进展是将个别个案的反事实转换为关于一 
个必要原因的规律性陈述。实际上，分析者在循环中始终与定义2相 
伴，引入定义1的目的是便于产生跨个案的推广。要想保留定义2,需 
要假定该定义可以被直接扩展到许多个案中，由此可实现推广。 


6.4 结论 

休谟的著名引文包含对因果关系的两种定义。定义1表明一个介 
于原因和效果之间的恒随性，从而使得一种效应总是紧随原因之后。 
该定义假定存在着多个个案，并与定量视角下的闪果关系具有亲和性。 
定义2表明因果关系的一个反事实观点，其中原因的缺失将导致结果 
的缺席。这一定义建立在单个个案之上，并与定性视角下的因果关系 
具有重要联系。 

虽然定量学者似乎自然更倾向于定义1，但是近些年来，随着人们 
将注意力转向反事实•定义2也在统计方法论者中间成为定义因果关 
系的起点。然而，定量路数很快就放弃了适用于个案的反事实因果观， 
并认为不可能估计这种因果关系。在统计学传承中，真的不存在两种不 
同的定义，因为每个定义单独存在都没有意义。统汁路数将两种定义融 
为一种，从不可能估计定义2转变为可能估计平均处理效应 ( ATK )。 

在定性传统中，这两种定义仍然独立。定义1被理解为代表着关 
于因果充分性的声称，而定义2被理解为代表了关于必要条件的声称。 
其结果是，不同群体的学者倾向于其中一种定义而不是另一个。一些 
学者运用诸如定性比较分析这样的方法来检验因果充分性，这些学者 
自然地倾向于定义1和充分性研究 （Ragim 1987)。相比之下，其他定 
性学者则探讨关于必要原因的假设，他们可能更自然地信奉反事实定 
义 2 (Goertz and Starr ， 2003)。然而，这两种关于因果关系的定义容易 

共存，因为它们根植于相同的逻辑学与集合论传统。 

是否存在对休谟的两种定义的正确理解呢？我们虽然不是哲学史 
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家，但认为人们所持的对休谟观点的最有用的 ffl 解将受其方法论背景 
和路数的强烈影响。我们认为•与两种传承之争相一致的是•每一种理 
解在其嵌人的总的传统中都有其道理。 
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7 

/ 个案内对跨个案的因果分析 


个案内比较对于小样本分析的可行性来说是关键。 

——戴维 • 科利尔 （David Collier ) 


7.1 导言 


定性和定量传统有一个最根本的区别，它涉及个案内分析和跨个 
案分析在因果推断方面哪一个更重要。在定性研究中，人们总是重点 
关注在个案内部发生的特殊事件和过程。关于假设检验的一些重要的 
定性方法论，如过程追踪和反事实分析，基本上都是个案内分析法。为 
了使用这些方法，定性分析者必须在其个体个案内部获得关键的观测 
信息。 

定性研究也经常包括一个跨个案的成分。无论对于社会科学中比 
较常见的小样本研究来说，还是不太常见的中等样本的定性研究而言， 
这都是成立的(参见附录）。尽管可以通过增加样本的规模来获得一些 
影响力•但是如果个案的总规模还是很小的话，那么因果推断的主要基 
础就必须源于个案内分析。小样本比较通常不保障对假设实施有效力 
的跨个案检验。©只有当定性研究的样本量增加，超过少量个案的时 


①某々检验的设 im 的是为了消除那吟设定有潜住的必要或充分原因的假设•小 
样本比较的确可允许诸如此类的检验1 
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候.才可能用跨个案方法进行存力的假设检验。 

相比之下•定量研究在传统上就包含着专门的跨个案比较。山 
于它们处理的是大样木数据.定量学者通常根本不了解个案。例如 • 
在调查研究中，学#除 r 知道受访科对特定问题的 n 答以外•对做答 
的个人几乎一无所知。当学者利用大样本的国家数据时•除了所测 
量的变量之外•对 iT •多国家都所知甚少。 1 11于人力和资源的限制，期 
待大样本的研究芥对他们的大多数个案都冇深入的理解是不现 
实的。 

然而 • rh 于定 M 学者可以就诸多特定的变量米系统地测 M 和比较 
个案，所以他们可以并旦的确通过跨个案的检验引出一些推断。原则 
I 二讲•他们分析的个案数量大，"了以有力地检验一忤发现•这些发现 "丁 
不单纯是随机的产物或者干扰变量的结果。定量研究各倾向于把他们 
的大忭本跨个案研究和深度的个案研究结合起来 • 就此而言，他们走向 
了一种不同的研究设计——混合方法研究设汁。 a 追求混合方法研究 
的时候.定 敁分析 荇便在单独的一项研究中将跨个案研究和个案内分 
析结合起来了。 

不管怎样，总体 而言 .小规模定性推断主要依赖于个案内分析.而 
大规模定量推断主要依赖于跨个案分析。由此•我们 "I 以阐述这两种 
范式之间的差异，这也是本章明确地关注的 任务： 

在小规模的定性研究中， w 果推断的主要手段源自个案内分析•跨 
个案的方法论有时候发挥一定的支持作用 a 

在大规模的 统汁 研究中， w 果推断的主要手段源 n 跨个案分析•个 
案内力法论有时候发挥一 * 定的支持作用。 

个案内与跨个案分祈的差异会通过本抒讨论的许多对比 呈现出 
来。还有一些重要成果 如乔治和贝内特 （（ icorgc and Bennett, 
2005) ， 科利尔、布雷迪和丙赖特 (Collier, Brady and Seawright • 
2010) ——探讨了定性和多元方法研究•提炼了定性和定量研究的对 
比。个案内与跨个案分析的差异也居于这种对比的核心。 
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7 个案内对跨个案的 W 果分析 


7.2 个案研究/小样本研究中的个案内分析对比实 
验/统计研究 

就个案研究相对于实验来说•简单地对比个案内分析和跨个案分 
析的典型角色(或非角色)是有用的。首先，考虑一个解释性的个案研 
究，其中要解释为什么一个特殊的个案会引发一个特别的结果。根据 
定义，个案研究主要聚焦于一个单独的个案，因此•跨个案分析不是其 
核心的推断模式。在个案研究中，也可能或明或暗地与其他个案进行 
对比和比较。此外，当利用过程追踪和反事实分析来检验假设的时候， 
研究者会利用来自其他个案的公认的概括和发现。然而，根据定义，个 
案研究主要是对单个个案进行持续的分析。 

在努力阐释一项好的解释时.个案研究者会不可避免地采取一种历 
时性的、过程性的个案分析。其中要考虑到在不问时间点上的许多不同 
的观测结果。当一些关键事件使个案走向某些结果而不是其他结果时， 
分析者就通常会确定这些历史关节点。他或她吋能停下来，去考虑在这 
些节点 h 的微小变化如何可能促使该个案朝着不同的途径发展。也可 
能考虑随着时间的推移，有历史意义的事件在哪些方面一个个地联系在 
一起最终产生一系列原因，进而带来所感兴趣的结果。这些全部的解释 
将可能是丰富的，能够 f 解有关特殊事件、关节点和意外事件的细节。 

现在考虑这样一项实验研究，它试图估计某种感兴趣的处理所带 
来的效应。在尝试阐述一个有效答案的过程中，通常要进行完全跨个案 
的分析。研究者会努力分离出所关注的处理带来的效应。针对大样本 
的个体(或者其他单位).要对实验组和控制组进行随机分配，这在理想状 
态下有助于抵消历史的和所有其他混淆原因的效应。设计的实验恰恰 
可以告诉我们•在去掉所有其他因素(包含环境和历史）的效应之后，有 
哪些纯的因果效应。在这个意义上，实验基本上就是跨个案的设计。 

在个案研究比对随机研究中使用的个案内分析和跨个案分析之间 
存在着差异。在当代政治科学和社会学领域•通常践行的是小样本的 
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定性研究和大样本的统计研究。当我们进入这些研究之时，上述差异 
便被大量地再生产出来。小样本定性研究者仍然最关心追踪个案内的 
过程分析，以便解释特殊的结果。虽然许多定性研究使用了跨个案分 
析并且经常利用简单配对法（如穆勒的求异法），但是其叙事仍然围绕 
着个案内过程来实施。实际上，除非研究的个案量大到一定程度，否 
则，不现实的想法是认为这些小样本比较方法本身能够为大多数因果 
推断提供强有力的基础。当我们从一个个案转向三、四个个案时，要是 
没有任何个案内分析，为了检验解释所用的手段就没有说服力。个案 
内分析必须在假设检验中担当重任。 

相比之下，大样本的定量分析却保留了大多数实验性的关注点，即 
利用跨个案分析来估计排除了其他所有影响的净因果效应。当然，吋 
间序列统计技术——与过程追踪法自然对等的定量方法——已经存在 
了几十年（如 Box and Jenkens ， 1976 )。 然而，纯粹的时间序列分析在 
政治科学和社会学中却很少见。间歇时间序列分析 （Interrupted Time 
Series Analysis) 也有很长的历史（如 Campbell and Stanley ， 1963 )， 但 
是，随着最近人们关注断点回归设计 (regression discontinuity designs) 
(^P Dunning, 2012) ， 它获得了新生和 新名。 在实践中，统计结果常常依 
赖于时间序列和截面方差 （ cross-sectional variance ) 的（几乎未被分析过 
的)各类混合体。对于任何给定的研究来说，人们可以询问，方差中有多 
少是截面的，又有多少是时间序列的。然而，甚至在某些看似有很大时 
间序列成分的领域(例如，在 30 年时间里对 20 个工业国进行 比较冲 ，大 
多数变异也都是截面的。因此•虽然许多定量分析考察了一个个案随着 
时间的变化过程，但是截面因素则完全驱动了坊间的研究成果。 


7.3 因果过程观测比对数据集合观测 

在两种传承中，个案内对比跨个案分析哪个相对重要，这个问题在 
科利尔、布雷迪和西赖特 (Collier, Brady and Seawright ， 2010) 讨论主 
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要的观测类型时被强调过。他们强调，这一点是在定性对比定量研究 
中获得因果推断的手段。他们将定性研究中的因果推断和“因果-过程 
观测” ( causal-process observations , CPOs ) 联系起来，这意味着并要求 

有个案内分析。相比之下，在定量研究中，因果推断所采用的主要观测 
是“数据集合观测” ( date~set observations , DS () s ) ，这种观测预设了一 

个截面研究设计。 

因果过程观测项 ( CPO ) 是“一种洞见或一组数据，它提供了有关情 
境或机制的信息，并在因果推断中提供手段” ( Collier，Brady and Sea - 
wright , 2010:184)。 正如这个概念的标签和定义所表明的，因果过程 
观测是从个案中获得的一组特殊信息，这些信息允许研究者去评估某 
个给定的原因项是否被一个假设或理论赋予了要承担的原因角色。 

下面三个例子有助于说明因果过程观测在定性个案内分析中的 
应用： 

1. 吕贝特 ( Luebbert ， 1991，308— 309) 利用来自德国内部的因果 
过程观测项 （ CPO ) 来驳斥格申克龙 （ Gerschenkron , 1943 ) 和穆尔 
( Moore , 1966) 的命题，即法西斯政权是由一群地主精英导致的，这些 
精英促使众多农民都支持法西斯主义。他呈现的证据表明•德国的地 
主精英并没有得到大量农民的选票。实际上，农村是支持法西斯主义 
的，但这主要出现在农民家庭占主导的地区，而不是精英所居住的地 
区。这些观测尽管数量小而且只来自一个单独的个案•却有力地挑战 
了格申克龙-穆尔关于法西斯主义起源的命题。 

2. 沃尔特 ( Walt ) 提出的假设 是：革 命引起战争。为了检验这个假 
设，他提出了一种理论来解释革命通过哪些干涉机制促成战争。这些 
机制包括革命性国家的偏好和生产力的变化，以及革命性国家和其他 
国家的关系的变化（比如，制造新的利益纷争和螺旋上升的怀疑）。如 
果该理论是正确的，这些机制就会表明特殊的因果过程观测 （ CPO ) 会 
岀现在个案中。沃尔特的经验分析关注七项个案研究，其中革命都和 
战争相关联。然而，该论点的优势并不是小样本中的革命和战争之间 
有简单相关关系。毋宁说，对该论点的经验支持主要源自如下事实，即 
沃尔特在每一个个案中都能指向因果过程观测，这种因果观测对应于 
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他预测的机制。 

3. 坦嫩瓦尔德 （ Tannenwald ，1999) 认为，“核禁忌”- * 种抵制 

核武器的规范禁令，它“将核武器指责为一种不可接受的大规模杀伤性 
武器”——是美国自第二次世界大战以来不使用核武器的原因。贝克 
(Beck, 2006) 提出这样的疑虑：坦嫩瓦尔德只分析了四个数据集合观 
测值 ( DS ())( 即四个历史阶段）•样本太小。相比之下，布雷迪、科利尔 
和西赖特 ( Brady , ('oilier and Seawright , 2006) 指出，在姐嫩瓦尔德的 

研究中进行因果推断的主要手段来自因果过程观测 （ CP ())， 而不是数 
据集合观测 ( DS ())。 尤其是，坦嫩瓦尔德呼吁重视高层决策者之间的 
特殊对话•这些对话表明对核武器的 持续讨 论甚至考虑都被主流规范 
所抑制。她的研究的优势并不建立在主要对四个历史时期的比较上， 
而建立在她有能力找到重要的个案内证据，这些证据表明，在有关核武 
器使用的争论中有越来越多强力的规范禁令。 

正如这些例子所表明的，定性研究者把因果过程观测和对个案中 
发生的事件和过程的研究结合起来。在这些研究中收集的因果过程观 
测项并不是可以被聚合到一个矩形数据集合中的变量值。它们是特殊 
的个案内观测项，承载着针对该特殊个案要考量的假设。例如，坦嫩瓦 
尔德的一些关键数据就是来自外交政策制定者的一些特殊陈述，他们 
在其能力范围内好像被迫去提高使用核武器的可能性。她的论点的力 
度源自如下事实，即在美国除非有一些规范禁令使核武器的使用污名 
化了 即核禁忌，否则这些论述都将不复存在。同样 W 特关于德 
国的专业知识也为他提供了专业信息，这些信息严肃地挑战了这样的 
观念，即地主精英要为投票支持法两斯负责。只表面了解德国历史的 
学者是不能给岀这种论证的。 

相比之下，定量研究中的标准观测是数据集合观测.它相当于矩形 
数据集的行，即给定的某个个案在所有被测量变量上的数值。在主流 
的统计研究中，增加数据集合观测是提高自由度的一个标准方法。来 
自特定个案内部的潜在孤立和不可比较的观测——即因果过程观测 
( CPO ) 并不用在定量范式中。如果信息只适用于一个或少数个 
案•这样的信息会被抛弃•因为它不能和统计检验联合起来应用。 
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在为了统汁检验而收集数据集合观测项的时候要求有个案内数 
据，但这只在如下意义上才有如此要求，即分析#必须通过大 M 个案来 
测量特定的变量。分析者无须持有关于任何特殊个案的专门知识。个 
体个案的历史细节及特殊性质与统计检验无关。原则 h 讲，对于个体 
个案来说，人们除了知道他们在所测量的变量 h 的值之外•可以在对他 
们的诸多特征知之甚少的情况下很好地检验一个因果模型。① 

总之，当定性和定量分析若在他们的研究中“加入新的观测”的时 
候，它们通常意味着不同的事情。对于定性研究者来说，这通常意味 t 
在某些特殊的个案内部发现了新的证据或事实。这类似于在侦探工作 
中发现新的线索 :新事 实被揭露出来•比人们吋以在与特殊的个案相关 
的假设和理论方面做出强有力的推断。相比之下•对于定量研究者而 
言，加入新观测项通常意味着加入了新的个案，即加入了一些主要分析 
单位的例子。在定量传统中，难以想像 加入了 观测却没有增加样本规 
模。但是在定性研究中，加入因果过程观测项通常不影响个案数量。 
实际上，在个案研究中，人们可以只研究一个个案（即一个数据集合观 
测项），但是有多个有效的因果过程观测项 来为闪 果推断提供一个有力 
的支持 ( Collier，Brady and Seawright ，2010) 0 


7.4 过程追踪检验对比统计检验 

过程追踪法在定性研究中得到了广泛使用，这也表明了个案内分 
析对于定性传统的重耍性。尽赞对于定性研究行来说 ，过 程追踪并+ 
是唯一可行的个案内模式的假设检验 （参见 第 9 章）.但它是一种处于 
中心地位的定性方法•它与苺于跨个案分析的假设检验的统汁方法形 
成了鲜明的对比。 


①然而.要想 iK 确地设定一个能够得到统 n •检验的 w 果模队作.往要求付个案的性 
质有很好的了解 n 
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在一个特殊个案中的特殊结果有哪些原因•人们可就此提出一些 
假设.过程追踪法被用来评估此类假设。①这种方法建立在两种主要的 
检验基础上 :箍筛 检验和确凿证据检验 (Van Evenu 1997)。正如我们 
将看到的那样，在过程追踪检验、关于必要或充分条件的概括和特定个 
案内观测（即因果过程观测）的应用之间存在着固有的联系。 

7.4.1 箱筛检验 

箍筛检验指的是•要想保证关于单个个案的假设是有效的，某项给 
定的证据必须存在 f 该个案中 (Van Kwm ， 1997)。虽然通过了箍筛检验 
并不会确证一个假设•但是不通过箍筛检验却能拒绝假设。在此意义 
t ,箍筛检验提供的证据是使假设有效的一个必要条件 ( Bennett , 2008) 。 

箍筛检验吋以涉及自变量、因变量和机制（参见 Collier . 2011； 
Mahoney , 2010， forthcoming ) ，当该检验涉及自变量和因变量的时 
候.分析者需要用因果过程观测来确定的是•原因和结果的发生是否遵 
循了由所探究的假设来设定的方式。箍筛检验通常通过质疑一个个案 
的描述性事实来挑战一些假设。 

例如，如第4章所〖寸论，在2000年佛罗里达州的总统选 举中. 媒休 
提前宣布了阿尔 • 戈尔的胜利，布雷迪⑴ mdy . 2010) 在分析这种提前 
宣布的影响时使用了箍筛检验。他在使用箍筛检验过程屮要识別一些 
必要条件•这些条件令媒体宣告造成布什损失掉佛罗里达州选民 < 的 
选票。这些必要条件包括以下四种 ：（ 丨 ） 选民住在佛罗1达州东部的一 
些走 廊县； （2) 媒体宣布时•该选民还没有投票； （3) 选民能听到媒体宣 
布，并且 (4) 选民支持布什。 

在这些箍筛检验的基础上•布雷迪考察了可能不投票给布什的选 
民，他排除 r 几乎所有的佛罗里达选民。实际上，他估计只有280位选 
民能通过全部四个检验。他认为在这280位选民中.大多数人没有被 
阻止去投票(比如，人们出于多种原因才投票，而不出于如下事实，即他 
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们的单张选票将决定总统人选）。这使得他的估计值降低到28 -56 张 
缺失的选票(他将估计值乘以4,达到上线估计值224)。但是•正是箍 
筛检验才在布雷迪的论证中担当重任。 

实际上•分析者也可以用箍筛检验去探究在一个自变量和一个因 
变 M 之间是否有因果联系。这些箍筛检验将注意力引向在设定好的原 
因和结果之间的干涉机制。例如.考虑一下前文提到的吕贝特反驳格 
申免龙-穆尔的假设（即在德国，压榨劳动力的地主精英是法两斯出现 
的一个关键原因）。要想使该假设柯效，一个必要条件是地主精英自:接 
或间接地控制农民•使农民投票支持法西斯主义候选人。然时•吕 W 特 
利 JI 1 来自德国的个案内数据表明这种机制是不存/£的。德围的地主精 
英要么不会拉农民的选票，要么如果可以的话，他们吏关心的是如何维 
持庇护网并实际支持自山党候选人。因此.该假设没有通过箍筛检验， 
只能放弃掉。 

没侖通过箍筛检验以视为证伪一个假设的标准//法。但是•通过 
了箍筛检验就能为支持一个假设提供强有力的 i £ 据吗？答案是“取决于 
具体情况”。尤其是，这取决于植筛检验的相对难度。通过了一个 W 难 
的输:筛检验的确能为一 * 个假设提供实质性的积极支持 • f U 通过一 * 个简单 
的箍筛检验却+能。就像某些圆箍 W 比其他圆箍小而更难以跨越一样. 
一些箍筛检验的要求更高，因而难以通过 ( Mahoney ， forthcoming ) 0 

一条假设的成立需要有必要条件.通过一个箍筛检验的相关难度 
与这样的条件在数据或现实中出现的频次直接相关。如果这些条件总 
是存在，擁筛检验就容易，因为假设将几乎•会自动迪过检验。相比之 
下，如果使假设得以成立的必要条件在给定的环境中很少见或异常•箍 
筛检验就很难通过（参见 Hart and Honore , 1985: l ) raumoc ' llc.T and 
( joertz , 2000； Goertz , 2006； Ragin . 2008)。 

7.4.2 确凿证据检验 

确凿证据检验是这样的 ：如果 存在某些特殊的证据(即特殊的 W 果 
过程观测项），假设就必然成立。通过 r 确凿证据检验.就会为假设提 
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供决定性的支持.尽管没有通过确凿证据检验 di 不会消除该假设。在 
此意义上，在确凿证据检验中被确认的因果过程观测项的存在就是使 
该假设成立的一个充分条件。① 

和箍筛检验一样•确凿证据检验也涉及一个自变量 、一 个因变量或 
一种机制。例如，在坦嫩瓦尔德的研究中，她用确凿证据检验确立了她 
的主要自变 M - 核禁忌——的存在。她有一些特殊的例子，其中的 
决策者在关于外交政策的 i 、 l •论中，通常在其能力范围内恰好被限制提 
出使用核武器的 N 题。核心的确凿证据是决策者的闭门讨论。如果没 
有核禁忌形式的证据 ( gun ), 他们的评论——即确凿 （ smoke ) 也就 
没有任何意义了。 

虽然通过确凿证据的检验可以作为证据有力地支持一个假设，但 
是没有通过一种确凿证据检验的结局就各冇不 M 了。某些确凿证据检 
验比其他检验更不容易通过。没有通过一种容易的确凿证据检验，就 
证明这个假设无效。例如，现在考虑一下约翰•斯诺 （ Snow ， 1855, 
1965;也见 Freedman , 1991 ) 的著名研究•它 证明 ，霍乱是一种传染性 
的疾病，而不是空气中有害气体（即瘴气）的产物。要给岀支持瘴气理 
论的一个相对容易的确凿证据检验•就需要表明疾病有 nl 候即使不通 
过人类携带的 方式， 也会传播到其他地方（如岛屿）。然而斯诺的发现 
恰恰 相反: 疾病总是跟随人类的旅途。尽管这个证据还没有完全反驳 
瘴气理论，但它当然是一重击。相比之下，即便不通过一个 W 难的确凿 
证据检验 . 也不会提供太有反驳性的证据。如果确凿证据检验相当难 
以通过，即便一个假设是有效的，人们也未必期待它得到通过。例如 • 
在佛罗里达的走廊地区，有1万名特定的选 W 要投票给布什•似是当他 
们听到了媒体宄行公布的选乎结果后•决定不投了。具体地确认这1 
7/名选民，就成为支持洛特 （ I 』 m , 2000) 观点的确凿证据。然而•这是 
一 个非常 W 难的确凿证据检验•事实 h 它不会得到支持，这个唷实+会 
对洛特的观点产生多大冲击。相反•布雷迪 （Brady • 2010 ) 利用摘筛检 


①舍洛克 • 霍姆斯 (Sherlock Holmes ) 有一句名言 :一旦 你消除了所有不可能的解释 
(即箍筛 检验〉 .剩 K 的一 1、必然为真这发明.人们完令⑴箍筛检验就能伏 W il : 确的 解释。 


10 S 



7 个案内对跨个案的因*分析 


验来反驳这个观点。 

一项确凿证据检验的相对难度是与检验中使用的条件的普遍共性 
(即因果过程观测）相关的。所有的确凿证据检验都要参考这样一个条 
件(或者是条件的组合），即该条件的存在足以使所研究的假设成立。 
然而，这个条件出现的频次各不相同。在一种已知的情景下进行检验 
时，如果条件经常存在或“正常”，但是假设可能没有通过确凿证据的检 
验，那么，这样的假设比那些条件很少出现情境下没有通过确凿证据检 
验的假设更可能是错的。 

在社会科学中，我们怀疑学者通常不能使用确凿证据检验来确证 
假设。收集到的典型证据更像是弹壳 （shell castings ) 而不是确凿证 
据:它 的出现倒是一项确凿 证据. 但是确凿证据本身却没有被观测到。 
通常情况下，需要将一些关键证据组合起来形成一个真正使人信服的 
证据。继续这个隐喻，如果事实是嫌疑犯有一把枪与那些弹壳相匹配， 
再将岀现的弹壳和这个事实结合，这样的话•弹壳看起来就更容易作为 
证据去确证这个假设。或者我们回到斯诺对霍乱的研究 ：他用 多种不 
同的证据去支持传染病理论(参见第8章）。 

定性研究者经常将多种证据组合起来以尝试获得充分性•这恰好 
符合在该传统中应用的典型的因果模型——即它是一种组合模型，其 
中的因素组合对于结果来说是充分的。结局就是，对一个个案的令人 
信服的解释通常要求有多条证据，这些证据加在一起构成了一个确凿 
证据的解释。单独一项观测不足以支持一个假设。相比之下，多条个 
别的证据很容易意味着箍筛检验的失败，因此拒绝一个假设。这有助 
于解释为什么定性研究者经常发现很容易使用个案内分析来消除一个 
假设，而不是确信地支持一个假设。 


7.5 结论 

跨个案分析和个案内分析分别是大样本分析和小样本分析中的核 
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心的因果推断模式•虽然如此，人们当然没有理由不能设汁出一项诉诸 
这两种分析方式的研究计划。事实上.在两种传承中，最好的实践所指 
向的研究设计通常将二者组合在一起。 

如在下一章中会进一步讨论的那样，在定量方面，统计研究者会越 
来越普遍地用定性的个案研究来补充他们的研究工作 。 来自回归分析 
的一个原因变 M 吋能用个案研究加以考察，以便确定它是否按照正在 
检验的理论所设定的方式起作用。在这种补充性的分析中，研究者使 
用个案内分析，同时搜索这样的一些因果过程观测项，即这些观测项在 
评估一个变量的因果影响方面具有可提供证据的价值。在定性研究方 
面，当研究者就一个或少量个案做出一个发现的时候，人们不禁会问， 
这个发现是否具有普遍意义(参见第16章）。因此，小样本的发现可能 
会刺激一个范围更广的利用大样本的跨个案检验 (Lijplwu 197])。 

总之，大多数实际的研究主要依赖于跨个案分析或个案内分析，尽 
管如此，这两种模式能够并且（根据许多重要的方法论学者的看法）应 
该经常被组合起来。不同类型的多元方法研究越来越流行，这表明学 
者正愈加寻找一些方式来达到这种综合。 
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当运用过程追踪法进行因果推断的时候，通过引用因果机制 

来解释便 . 提供了因果推断的有力来源，它可以在一些单独个 

案内细致地考察过程。 

- 亚历山大 • 乔治 （Alexander L.George) 

安德鲁•贝内特（八 ndrew Bennett ) 


8.1 导言 


我们对因果性的直觉理解包含这样一个生成过程，在这个过程中， 
一个原因通过引发某些机制和过程的运行而导致一个结果。当人们面 
对的数据表明两个变量之间有关联的时候，他们在声称这种关联本质 
上是因果关系之前，通常还额外需要与机制有关的信息 （Ahn，Kalish， 
Medin and Gelman, 1995)。 社会科学家也不例外:他们相信因果效应 
要通过一个过程传递到另一个过程。 

在社会科学和科学哲学领域，围绕“因果机制”观念提岀了大量的 
文献，其中包含一系列异质的观点和定义(参见本章给岀的推荐读物）。 
基于我们的目的，这里无须钻研其细节。相反，我们可以这样来理解因 
果机制，即它是原因导致结果所历经的介入过程。我们认为，任何得到 
相对较好发展的理论都会提供有关因果机制的讨论。这同样适用于在 
定量和定性研究传统中检验了的 理论： 这些理论提出的因果机制观点 
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将自变量和因变量联系起来。 

本章探 i 寸的关键问题是，当定性和定量传统在做因果推断时，如 
何经验地评佔有关机制的理论。在定性传承中•研究者在评估时，尝 
试通过过程追踪和对因果过程观测的分析来观测机制 （ Collier ， 
Brady and Seawright • 2010 a ，2010 b ； George and Bennett , 2005)。 在 

定性范式中，对特殊个案的个案内分析很自然地和观测机制的尝试结 
合在一'起。 

相比之下，统计方法的设汁可不是为了在特殊个案内部观测机制。 
使用统计量来推断——不管是基于观测数据还是实验数据 都依赖 
于对多项观测的跨个案分析。在这一传统中，如果一个变量在一次统 
计检验中发挥了所预测的效应•那么研究者可能预期某种给定的机制 
起了作用。然肘，他们通常不会从经验上去研究机制自身。变量为什 
么产生作用，这是理论的一部分，但是它通常不包含在统计检验中（参 
见附录）。 


8.2 机制和因果推断 


人们早就通过一些伪相关的例子(例如，一个地区的麻雀数量和该 
地区的生育率之间有关联）得出“相关不是因果”的结论。学生在第一 
门方法 课上, 就被教导去想象有没有第三个先导变量可以引起这两个 
变量，并因此可以解释相关(例如，一个测量城乡位置的变量可能既解 
释麻雀数量，也解释生育率）。然而，当同学们第一次遇到这些例子的 
时候，他们怀疑这种相关可能是伪相关，其原因通常在于这里缺乏直觉 
的因果机制，而不是因为他们立即意识到存在一个特定的先导变量可 
以解释掉这个相关。人们之所以怀疑麻雀-生育率相关问题不是因果 
关，是因为这里没有看似可行的机制 （ Porpora , 2008) 0 

* 在社会科学中，许多统计方法论学者都认定对观测数据进行因果 
推断是极其困难的。观测性研究缺乏受控实验的随机安排.要求用控 


116 




8 闪采机制与过程追踪 


制变量来处理混淆因素。我们常常从年轻的定置方法 论学者 那里得 
知 .[ n 」 归尤非是数据描述。①它最多会被认力是一种生硬的因果推断工 
具（参见 Collier，Brady and Seawright , 2010 b )。 

可见,用观测数据做闶果推断是有挑战性的•学者已经认识到这一 
点，进而激起了在实验方面逐渐增长的兴趣。社会科学现在从事着各 
类实验研究，包括凋查实验、实验室实验和田野实验（当然，心理学早就 
一 直在使川实验）。在政治科学顶尖杂志 M t 常看到利用实验法的论 
文。甚至当方法论者讨论回 H 设计时•现 ft 也经常接受一些实验术语- 
如处理和控制。实际 h •对于某些定量方法论学者而言，新的口号也 
许是： 


没有实验.就得不出强有力的因果推断。 


有了良好的实验设汁•人们就可以在没有观测到闪果机制的情况 
r 来评估一个给 定处理 的平均效应。正如格林及其同事所指 出：“ 仅通 
过操控变 m 并测敁其对结果的影响邰可以 r 解很多理论的和实际的价 
值，不管这些影响通过怎样的因果途径。” ( Green , et al .， 2010:206— 
207)® 然而，如同在所有的科学中一样，在社会科学中，如果可能的话， 
学者仍然希望填满实验的黑筘。当研究荇呈现实验结果的吋候，他们 
通常必须 l " J 答有关机制的问题，这种机制把处邢和效应联系在一起。 
他们尝试努力做出解答•因为一个良好的现论会在一个观测到的效应 
背后确立其机制。 

相比之下 • 在定性研究中，研究者将机制的鉴別当做因果推断的关 
键。他们把机制看做一种非实验性的、将因果关系从伪相关中区分出 
来的方式。 


① “如朵没有实验、 n 然实验、中断或 K 他强存力的 Kit. 洱多的 i 十量经济学或统汁 
建模也不能令人信服地从相又走向因果。” (Sckhon ，2009:503 > 

② 用实验法来研究中介项.这项 IHhfll 临着很多闲难（参见 Bullock and Ha, forth¬ 
coming). 此外•用观测数据对中介项进行评估的统汁技术要求有非常强的假定，因此在 
实践中难以实施(例如， Imai ct al., 2011)。 
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在因果推断中，机制可以通过两种方式起作用。 X 可以通 
过某种机制影响 y ， 认识到这种机制的存在即可支持一个推断， 
即入是 y 的一个原因。此外，如果缺乏将 x 和 y 联系起来的看 
似可行的机制，我们就有很好的理由去怀疑二者之间是否有因果 
关系。……尽管这种怀疑可能太强了，以至于不能说机制的设定 
对于因果推断来说总是必要的，然而一个令人完全满意的社会科 
学解释还是要求对这些因果机制加以设定。 （ Hedstr 6 m and Yli - 
koski • 2010:54; 也可参见 George and Bennett ，2005) 

人们甚至可能认为在定性传承屮已经发展出 r 一种规范，它使强 
因果推断要求在个体个案内部进行过程追踪•以便考察所提出的因采 
机制是否存在。如此看来，对于定性学者来说，口号或 许是： 

没有过程追踪，何谈强因果推断。 

W 此，定量和定性范式关于强因果推断有不 M 的看法。毫不奇怪 
的是 • 一 方可能对另一方的标准抱有怀疑。例如，过程追踪可以力因果 
推断提供有力的支持•这种观念在定 M 传承中并没有得到广泛的认 M 。 
金、基欧汉和维巴提议到•过程追踪“+那么容易产生强 W 果推断” •只 
能“提 TI •描述性的概括，为因果推断提供一种途径” （ King ， Kcohane 
and Verba , 1994:227 228)。 其他学者则强调，因果机制不是在因果 
分析中解决根本问题的“奇迹创造者”（如 Gerring , 2010； Norkus ， 
2004 ) 。从统计视角来看，关于因果机制的推断必须符合好的 W 果推断 
的要求•即因果机制适用于任何潜在的处理或变 M 。 因果机制不要求 
对因果性有新的理解 （ King ， Kcohanc and Verha , 1994 )， 尽管在估计 

闪果机制的效应时所涉及的计嗌经济学难题有特殊性（例如 . ManKm - 
non , 2008)。 

过程追踪可以在多个方面与大样本分析有交集 （ Collier , Brady 
and vScawright, 2006， 2010(、）。 有时因果机制首先在个案分析中被挖 
掘出來，然后利用大样本分析去确证这个发现。例如，町以考虑斯 m 
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的研究，他向我1展示了水（而非空气中的沼气）是霍乱传播的机制 
( Snow ，1855, 1965，也可参见 F reed man , 1991 ) ①。斯诺像—■位典型 

的定性分析者那样幵始自己的 研究： 始于深入考察 V =1 的个案，即霍 
乱病患者。他注意到•某种病原菌 (causal agent ) 看起来首先攻击了消 
化道。这使受污染的水或食物可能成为疾病传递的机制。他进行了其 
他关键的观测 :海员 只冇在靠岸或补给时才会感染疾病•这些疾病跟随 
商业路线传递，而如果个体居住的房屋有单独的水供应•他们通常就不 
会感染疾病。他利用相邻的两个房屋设汁了一种求异法 :其中 一个房 
屋有污染的水。他针对选出来的个体进行了同样的实验。然后，他用 
一种准实验令人信服地证明 f 该假设•这个准实验所用的数据来自大 
M 的从不同渠道获取水的房间 （ Dunning ， 2008)。大样本的自然实验 
确证了他此前通过定性研究得出的因果机制。 

有时候，我们 / K 观测数裾中通常有一个大样本的统计发现，侃是其 
因果机制有争议。住这种情况下•过程追踪 Oi 被用来对相互竞争的机 
制加以 裁断。 例如•一项长期的跨国定最研究发现，经济发展（经常用 
人均 GDP 来测量）和民主正相关（参见 Robiruson ， 2006的述评）。实 
际上•这种关系在政治学和政治社会学中被认为是最稳健的发现之一 
( tl \ Geddcs . 1999)。然而，儿乎对于任何人来说,这项发现看起来都是 
末完成的 • W A 它留下了一个黑筘，而 II 不允许学者去 评估凡 他备选的 
机制理论。对于定性研究者来说，必须用详尽的分析来充盈黑箱，即分 
析在一些特殊个案中导致民主的实际序列。为了 K 分出在因果关系被 
建立之前的机制，人们必须走出统 H •相关，走向定性分析。 ® 

L 1 丨舍迈耶、斯蒂芬斯和斯蒂芬 （ Rueschemeyer . Stephens and Ste ¬ 
phen - \ 992 )(m 资本主义发展和民主》就是一个优秀的例子，该书尝试 


① 这个例子是科利9;，布雷 迪和两 赖特 ((’ oilier . Brady and Seawright , 2006, 
20 U ) c ) 与贝克 ( Beck . 2006. 2010) 之间争论的核心。 

② 如吕舍迈耶、斯蒂芬和斯蒂芬斯所 说:“ (发展和民主之间关系的 ) 重复性的统计发 
现行一个特殊的‘黑筘’特征.这个黑 筘只有 通过基于良好观论的经验分折才能被 克服. …… 
我们认为，比较历史研究最有可能点亮黑箱。……历史研究向事件序列及其与周遭结构 
条件的关系赋 f •洞见.在提供有效的因果解释时.这一点不可或缺。因果分析实质 h 是序 
列分析 u ” 
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利用历史研究，在个案内观测因果机制。他们提议到，发展促进了不同 
阶级（尤其是地主和 X 人）之间权力平衡的变化，而这种变化是民主的 
关键性机制。具体而言，他们给出的假设认为，发展可以促进“完全”民 
主的两个必要 条件： n ) 有权势的地主消失， （2) 出现强力的、赞成民主 
的工人阶级。①尽管这些要素几乎是普遍的机制，他们却不是充分条 
件。民主化取决于与国家、政党、国际体制有关的其他要素。 

在定性研究屮，由于过程追踪是如此居于因果推断的核心，以至于 
该传统中的研究者会怀疑那些不能确认或检验因果机制的研究。例 
如，如果大样本的发现未经后续真正因果性过程追踪的证实，他们可能 
就不确信这些发现。通过细致考察个体个案，可能引发对来自统计学 
或形式分析的假定性因果机制的怀疑，这样的个案并不难发现。 

1. 丘萨克、艾弗森和索斯凯斯 (Cusack，Iverson and Soskice, 

2007) 认为，在西欧，商业和劳动力的经济倾向是将整合的劳动力 
市场和比例代表选举制 （ proportional representation electoral 

systems) 的创立连接起来的关键机制。这些学者在劳动力市场整 
合和比例代表制之间找到了显著的统计关系。然而，他们并没有 
考察商业和劳动力的制度性倾向.这些倾向被假设会驱动这种关 
系。为了审查这种论证，克勒泽 （ Kreuzer ， 2010) 考察了历史研究 
是否提供了任何证据证明这些行动者关心选举制度的形式。在看 
完丘萨克、艾弗森和索斯凯斯的18个个案中的每一个之后，他总 
结道，他们提议的机制并不起作用 ：“ 我不能找到任何证据将商业 
团体、工会、党派或者它们各自领导者的制度化倾向与劳动力市场 
关联起来。事实上，我不能发现任何证据表明商业或工会明确地 
偏爱某种选举制度而不是另一种。关于党派的制度化倾向已经有 


①“民主只有在以 K 条件 F 才会建 立起来 ：（1)地主的力量不强•或者 (2) 他们不依 
赖大 M 廉价芳动力的供应，成者 （3) 他们 不会控 制国家” （ RKhcmcycr . Stephen and 
Stcpuhcns . 1992：270 ) o “有组织的丁.人阶级在几乎任何地方都以一个关键行动者的身份 
出现在完全民主发展的国家中.唯-的例外是-些小型国家中的土地民主案例 （agrarian 
democracy ) M ( RucscluTtK ' ycT . Stc[)htn and Su'fHilicns ， 1992:270) 
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大量的讨论，但是没有任何一个指向经济因素。” （ Kreuzer ， 2010： 
376)® 

2. 科利尔和赫夫勒 （Collier and Hoeffler , 2001)，费伦和莱廷 
(Fearon and Laitin , 2003) 使用跨国统计分析，发现人均 GDP 与 
内战有强的负相关关系。然而，这两组作者在因果机制上出现分 
歧：科 利尔和赫夫勒从贫穷对经济机遇的影响角度来理解机制，而 
费伦和莱廷却从国家避免内战的能力角度看待机制。基于个案研 
究的证据，桑班尼斯的发现只部分支持了二者提出的机制。他认 
为，人均 GDP 可能在与其他变量的交互作用中发挥影 响：“ 不同的 
国家对待内战有不同的倾向，原因可能与其他自变量（如种族与民 
主）在各种收入水平上的表现方式有关。” （ Sambanis , 2004: 266) 
桑班尼斯表明，在科利尔、赫夫勒和费伦、莱廷的理论中提出的机 
制缺乏经验支持，令人质疑其实际效用。“如果大样本研究在因果 
路径方面做出了错误的假定，它们就会缺乏解释力……我们知道， 
通过增加人均 GDP ， 就会在一定程度上降低内战的风险，但是一项 
更有针对性的政策干预可能更有效率，也更易执行。” （ Sambanis , 
2004：273) 

3. 阿西莫格鲁和罗宾森（八 cemoglu and Robinson , 2006) 认 
为，在经济高度不平等的国家中更容易发生军事政变。他们运用 
博弈论区分出一种机制来解释这种关 系：民 主政治下的再分配数 
量在不平等的社会中会较高，因此，精英们会有更大的热情去招募 
军队推翻民主政治。然而，斯莱特和史密斯 （Slater and Smith , 
2010) 批判了这种解释，他们的个案研究证据表 明：“ 军队事实上几 
乎不是代理人，并且很少成为经济精英的同盟。”通常情况下，军队 
发生政变的原因与精英阶级的特殊经济利益无关。因此，他们认 
为，与阿西莫格鲁和罗宾森的博弈论模型相联系的因果机制在绝 


①丘萨克、艾弗森和索斯凯斯 ( 〔 'usack，Iverson and Soskice. 2010) 在反驳中认为， 
党的领导人参与经济事务，因而不希望工人及商业领袖积极推动一种特殊的选举制度^ 
相反，他们认为党的偏好应当是在检验因果机制时所关注的核心。 
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大多数军事政变中并不存在。 


总而言之，如果实验与非观测性的分析不能识别出机制，定性研究 
通常会质疑它们。在定性传承中，如果机制不为人所知，解释就是无 
力的。 


8.3 多元方法中的过程追踪对比定性研究 


随着多元方法研究的兴起，过程追踪 （Process t raci ng ) 不再是定性 
研究的特有领域了。在某些领域的定量研究者中间，过程追踪已成为 
一种“时尚需要 ” (de rigueur )， 它在整体分析中包括单项个案研究。这 
种趋势与我们前文讨论的回归分析的滑坡有关。对所选的个案进行集 
中的过程追踪，认为它可以补充在不能进行实验的环境下的大样本研 
究。统计分析提供的证据可能表明，一个假想的因果机制在一个大的 
个案总体中起作用。然后，针对所选的个体个案进行过程追踪，即可用 
于探索因果机制是否如广而告之的那样起作用。这种多元方法策略突 
出地体现在最近的一些重要研究之中，这些研究首先给出大样本的统 
计结果，然后紧跟着对多个个案研究的分析（例如， Forma ， 2007； 
Lange ， 2009； Lieberman , 2003； Pevehouse . 2005)。 ① 

尽管人们趋于认为过程追踪可以作为一种有用的因果推断工具， 
不过，那些用过程追踪来补充统计发现的学者对该方法的使用好像与 
定性研究者的使用方式并不一样。过程追踪在补充统计发现中的运用 
因如下事实而变得复杂，即在统计分析中，随着从总体走向个案，因果 
过程未必稳定。例如，在一项统计研究中，设想一下 X ,在总体中有显 
著的正影响。这是否意味着 I 不能对一个特殊的个案子集 （subset 


①博弈论传统中的某些学者也转向了过程追踪.他们将其视为一种手段，用来检验 
他们的形式模型的可观测到的意义，例如贝茨等 （Bates et al .， 1998)。 
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of cases ) 发挥负影响？答案当然是“否”。在从超集到子集再到个案的 
过程中的影响总是因统计模型 而定； 没有什么数学原因可以说明 
为什么&不能与特殊子集中的结果负相关。因此，当执行过程追踪 
时，我们不能确认因果机制在随意选择的特殊个案中是否如预期的那 
样是奏效的。 ® 

为了用过程追踪来补充统计发现，分析者通常尝试挑选一个或多 
个个案，其中，所感兴趣的主要自变量应该扮演由理论所赋予的角色 
(参见第14章）。然而，当从总体走向子集合的时候，统计发现也可能 
不稳定，正因如此，分析者事实上从未在个体个案的数据集合值、统计 
模型中的参数估计值以及来自个体个案研究的观测值之间建立直接的 
关联。当统计研究者在特殊个案中运用过程追踪时，他们的特殊回归 
结果会趋于脱离图像。 

始于统计模型的过程追踪研究者在进行个案研究时，通常将所感 
兴趣的自变量非正式地视为是一种有贡献的原因要素。在针对整个总 
体经常用到的加法模型 (additive model ) 中存在着多种原因，但所关注 
的主要变量只是其中之一。可以将该变量的效应大致看成是对因变量 
的一种原因权重。因此，当在一个个案中针对该变量进行过程追踪时， 
研究者探索的是它如何为结果变量“做贡献”或“加权重”。然而，分析 
者通常并不认为个体变量对于结果来说是必要的。定性研究中的过程 
追踪是围绕反事实进行的，而当用过程追踪来补充统计学研究时却不 
如此。 

当用过程追踪来补充统计分析时，它的另一个特点涉及其他变量 
(即控制变量，而不是所关注的变量）的角色。由于它们不是研究者特 
意关注的变量，在过程追踪分析中通常也不受重视。控制变量的作用 
必须被承认，但是注意力要转向感兴趣的主要变量。 

在定性研究方面，研究者未必始于已经被过程追踪所验证的跨个 
案的发现。相反，他们可能从过程追踪开始，并用这种方法作为因果推 


①方法论者对此已有一个回应，即他们认真思考如何根据初步的回归结果来挑选 
用于过程追踪的个案(参见第章）。 
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断的基础。然而，出于比较的 S 的，我们还是假定定性研究者始于一个 
运用于某个个案总体的集合论模型。该学者在进行个案内的过程追踪 
时，会针对因果关系保持一种集合论研究路径。这是对的，因为在集合 
论的架构下，某种因果模式可应用于作为一个整体的总体之中，而总体 
中的特殊个案会同样遵循该因果模式。当学者在执行过程追踪时.会 
认为个体个案中的原因对整个总体有相同的效应。 

因果效应在从总体到个案中的这种稳定性最容易用必要条件来检 
视。在一个总体中，如果 a 是 y 的一个必要条件，那么 a 必然是该总 
体中任意一个个案(或个案子集）的必要条件。就一个实质性的个案来 
说，现在考虑这样一个假 设:威 权政体是大屠杀的一个必要条件。如果 
该假设成立，则它会适用于任意一个大屠杀个案。在假定该假设一致 
地适用于所有大屠杀的情况下，人们就可以进行过程追踪了。 

从总体到个案的这种稳定性也适用于分析诸如下面这样的一个集 
合论模型中的充 分性： + 如果一个个案有某种组合（即 
或者是 A * B ^ c 或者是 D * E )， 它就会有感兴趣的结果。为了探究 
机制，过程追踪会选择这样的一个个案，其中或者出现 A &， 或者岀现 
/)£：，但两者不能都出现(参见第]4章“个案选择与假设检验”）。然后， 
分析者会探索诸如 A 、 Zi 和 r 如何组合起来创造出结果。当进行过程 
追踪时，研究者将探究这种因果组合通过怎样的过程才产生了感兴趣 
的结果，要努力区分出这些特殊的过程。 

当定性分析者就一个特殊个案中的某种因果组合进行过程追踪时 
(假定该个案只展现了可产生结果的一种组合），他或她可以将该组合 
中的每一个自变量视为该个案有此结果的必要条件。也就是说，如果 
Y = 1 这个个案只展示了一个因果组合，那么该组合中的每一个原因项 
对于在此个案中发生的结果来说都是必要的。如果模型正确，并且拥 
有 D * E 组合的某个个案缺少了 D 或 E ， 那么该个案将会体验不到结 
果。因此，人们在针对一个因果组合中的个体变量进行过程追踪时，通 
常采用与必要条件相同的方式。 

鉴于此，对于始于某种集合论模型的分析工作来说，当针对某个特 
定个案进行过程追踪时，它必须将被该个案拥有的因果组合中的每一 
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个变量都看成是必要的。然而.分析者通常不只关注一个特殊感兴趣 
的变量，因为该组合中的所有变量对于个案中的结果来说都是必要的。 
相比之下，当过程追踪与统计研究相结合时，关注点就是感兴趣的那个 
主要变量了。如果所关注的主效应是一个交互项，那么唯一用于补充 
统计研究的吋间过程追踪法 （time process tracing ) 就会关注一套原因 
(packages of causes ) 0 然而，要想确证在某个统计模型的交互项背后 
有哪些假定的机制，分析者可以利用过程追踪法,不过这样的实例还不 
为我们所闻。 

总之，当在个案中进行过程追踪时，每一种传承中的因果模型都倾 
向于保持其正确性。定性研究者运用的是一种集合论模型，该模型的 
基础在于，针对结果有诸多必要条件，还有合起来可充分带来结果的一 
系列条件。作为一般的规则，人们通过询问分析者是否将个体原因当 
做必要条件，并/或询问当他们讨论充分性的时候采用怎样的机制将这 
些条件组合在一起，这样便可以区分出一个过程追踪的定性研究。相 
比之下，在特定的个案内进行过程追踪时 •始 于统计模型的多元方法研 
究荇通常接受一种加法的因果研究路数。他们通过过程追踪，探究感 
兴趣的单个因素是否为一个特定个案中的某个特定结果做出贡献或增 
加权重。由于有如此多的其他原因被假定是有作用的，因此，他们不再 
假定感兴趣的要素对于结果来说是必要的。 


8.4 结论 

在定性传承中，标准的和自然的做法是研究因果机制，并用过程追 
踪进行个案研究。通过在一个或多个特定的个案中追踪 x 导岀 Y 的 
过程，就可以部分地推断 x 是 y 的一个原因。该研究传统中的学者常 
采用个案内分析•这个事实也推动了过程追踪。这种分析模式本身旨 
在区分出诸多机制，一个特定的原因要素可以通过这些机制在一个特 
定的结果上产生其效应。 
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在定量传承中，人们越来越关注回归分析在产生强因果推断方面 
的能力，这一点在两个方向上推动了方法论进程。一个方向是，各类实 
验愈加显耀(尽管在所有研究中只占少数）。通过实验，人们可以在不 
检验机制的情况下，很好地估计某种处理的平均效应。然而，由于几乎 
所有的社会科学理论都倡导关于机制的思想，因此，可以认为实验研究 
留下的黑箱是有问题的。 

另一个方向为，多元方法研究越来越被认为是最好的实践，在此类 
研究中，定量分析者将回归分析与个案研究分析结合起来。如果一个 
变量在回归分析中有显著效应，就会进一步在个案研究中考察它，这样 
即可决定它是否按照正在被检验的理论所假定的方式起作用。然而， 
与定性传统不同的是，多元方法研究中的过程追踪是依据加法模型来 
审视原因的。研究者不用过程追踪去检验 X 是否为 Y 的必要条件。 
相反，其主要目标在于探索 X 是否对 Y 的水平或出现有所贡献。 
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反事实 


我们准备支持这样一项反事实的宣称，即在已知20世纪80 
年代权力实质分布的情况下•快速没落中的苏联即便受老思想家 
的领导，也会在冷战时期最渴求和平。 

- 兰德尔 • 施韦勒 （Randall Schweller ) 

威廉 • 沃尔福思 （William Wohlforth) 

几乎不可想象的是，对于戈尔巴乔夫的总书记位置的任何一 
位竞争者而言，他们哪一位能着手•更不用说贯彻他那大胆的国内 
外改革。 

- 罗伯特 • 英格利希 （Robert English) 


9.1 导言 

反事实是社会科学方法论中的许多不同议题的核心。本章关注的 
是，当在定性与定量传承中进行因果推断时，反事实扮演着什么角色。在 
前一章中，我们 i 寸论了如何用反事实来界定因果关系本身 (参 见第 6 章 ) 。① 

①在定量传承中有一种“反事实路数”被称为 Ncyman Rubin - Holland 模型，因为它 
开姶于一个个体个案/‘的反事实。在哲学中，反事实的因果关系定义有着一个悠久而著名 
的历史（例如， Lewis ， 1973； Collins et al ., 2004)。 在定性方法论中，必要条件和反事实被 
看做有内在联系的（例如 ， Goert and Starr ， 2003)。 
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延续两种传承的主题，我们认为，反事实分析在定性传统中是一种 
重要的因果推断模式，但是它在定量传统内部并不常使用。这种差异 
的原因在于如下事实，即一个反事实的陈述内含着“与实际发生相反” 
这样的陈述。这些通常是关于单个个案中的一个特殊原因和结果的陈 
述，不涉及一个总体平均而言会如何发生。例如•本章的引语就针对一 
个特殊事件提供了经典的反事实论证。在这个个案中，该反事实宣称 
的是，如果像戈尔巴乔夫这样的新思想家没有掌权，将会发生什么，而 
在讨论观念抑或实质权力分配在解释冷战结束的原因方面扮演着什么 
角色时，上述反事实的宣称对于整个讨论至关重要。 

在针对一个特殊个案进行反事实的宣称时，人们通常需要针对该 
个案进行个案内分析。由于定性学者对解释个体个案感兴趣，因此，为 
了评价反事实宣称，自然会进行个案内分析。他们在不要求彻底重写 
历史的情况下，设想某个原因未曾发生过（或者以不同的方式发生) 
( Weber , 1949； Fearon , 1991 )，在此意义上，他们筹划的反事实是“可 

以想象的”。反事实分析本身的执行显然要考虑到这样一个“可能的世 
界” ( Lewis ， 1973)，即其中缺少前因或有不同的前因。 

相比之下，鉴于定量研究者对任何特定的个案不感兴趣，因而他们 
也不常针对特殊个案进行反事实分析。当运用反事实时，他们的目的 
主要是阐释一个总体的因果模型。例如，定量学者有时使用反事实来 
说明有关 X 对 y 的效应的总体平均量 （average magnitude ) 情况。这 
种传统下的反事实通常涉及对一个个案中的异常变化进行假设——例 
如，如果一个个案的 X 值从非常低变到非常高，那么估计该个案会发 
生什么？(相关的例子和批判，参见 King and Zeng ， 2006, 2007) 0 


9.2 因果推断的基本 问题： 不同的回答 

除了一些例外(如 Pearl , 2000) ，目前统计学关于因果推断的观点 
都始于一个个案的反事实。由于不可能实际观测到个体个案的反事 
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实•因此，学者面对着因果推断的基本 问题： 

因果推断的基本问题。不可能观测到同一个单元的 Y ,( n 与 
1(/) 的值，因此，不 可能观测到/对/的影响。 （ Holland ， 1986： 
947) 

因果推断的基本问题是一个反事实的问题。对于任何给定的个案来 
说，不可能让历史重演而使该个案在 X 上有不同的值。 

定性与定量传统的重要差异在于它们对于这个问题的回答。定量 
学者通过聚焦于平均效应的大样本的解来解决这个问题。因此，尽管 
反事实在定量传统中恰好是因果性定义的核心，但反事实分析却不作 
为选项来进行因果推断。关于因果性的 Neyman - Rubin - Holland 反事 
实观点并没有将自身引向对个案的明确的反事实分析。 

一旦利用统计方法计算出 f 的平均效应，研究者便可以使用这个 
参数估计值对总体中的任何一个特定的单元进行反事实分析。不过， 
本章的要点是认为，个体反事实在因果推断（即估算平均因果效应)过 
程中不起任何作用。人们不借助反事实分析也能获得佔计的平均因果 
效应。统计结果在先，而非在任何反事实分析之后。 

相比之下，对因果推断基本问题的定性回应是用普遍知识和个案 
内分析来进行反事实地分 析:如 果假定 X 在一个特殊个案上取了不同 
的值，将发生什么。定性分析者认为，某些特定的要素是否为一些特定 
个案结果的原因，有关这方面的假设是不能用已有的普遍知识和关于 
一 个特殊个案的细节知识来检验的。反事实分析是产生关于特定个案 
的因果推断的尝试的一部分。 

简单来说，定性和定量学者都认为，对个体个案进行反事实分析是 
可能的。然而，在定量范式中，这种分析并不是进行因果推断的部分。 
相反，任何反事实分析遵循的都是估计平均因果效应，用它来讨论已经 
做出的因果推断。相比之下，定性学者关注的是个体个案，并用现存的 
普遍知识和个案内分析对该个案的反事实进行推理。在该范式中•反 
事实分析常常是因果推断进程本身的一部分。 
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9.3 建构反事实 

9.3.1 统计步骤与极端反事实 

为了展示统汁学的反事实路数.一种有益的方式是考察在 logh 或 
概书平位分析中•作评价一个既定的参数 佔计量 时心什么标准的做法。 

这岬 模彻中，通 常没冇直接显叫的方式对闪果效成的规模进行概念 
化。分析者的一种解决方案是使用反事实来提供一种审视•即考 M 入 
对 Y 的效应 M 级。其标准步骤大致 如下： 

1. 将全部控制变量 （即 除了所关注的反事实变量 X 以 外的所 
有变量）都设定为均值或中位值——均值最可能被选。对于二分 
变量，则使用众数。 

2. 将反事实的先导变量 X 设定为最 小值； 一种比较保守的做 
法是取 25% 的四分位数或取值可能为低于均值的 1 到 2 个标 
准差。 - 

3. 令 X 值从最小值变到最大值（一种比较保守的做法是用 
75% 的四分位数或者高于均值 1 到 2 个标准差）•这就是反事实。 

4. 使用统计模型和参数估计法•根据 Y 的慨率变化来估计反 
事实。 

5. 用反事实中 Y 的概率变化来解释入对 Y 的因果效应量。 

尤数文章与研究荇都使用 r 这个步骤，里然分析 t 通常没有将这 
种做法与反事实推理明确地联系在一起。 

在这些步骤中 . x 从极低值变到极高值。 w 此•人们吋以说•分析 
行遵循的是一种 “M 大重写实践” （ maximum rewrite practice) 或行 ••极 
端反卞实路数’ （ cx 1 reme count cr factual a proa eh ) :反事实涉及 X 的 
最大或极端变化。这种实践可使研究者醒目地展示 X 的某种变化对 
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Y 的潜在影响。 

>] 1 定量研究者从事这种反事实推理时，他们通常+将反嗔实与任 
何特定的历史个案联系起来。同样地•对于正在关注的 X 来讲•他们 
很少追 N X 的一种既定改变有怎样的历史4能性 （historical plausihil 
ity ) o 如费伦注意到•这种改变是否现实并不要紧 . W 为它仅用于模型 
分析的 目的： 

在回归分析和其他检验因果假设的统计方法中.有人推断•如 
果样本中有任意一个特定的个案在一个自变量上取了不同的值， 
因变量便可能分化为在跨个案之间相同的一个系统成分 
(systematic component ) 和 一 个随机成分 （ random component ) 。 

至于能否假定任何特殊的个案在自变量上取不同的值，人们甚至 
永远不能深思这种假定是否真实，在历史上是否可能 。 （Fcarom 
1996：61) 

可见，在定 M 传统屮，针对个体个案的反事实是否可能，这个问题 
仍未引起注意金和曾 （King and Zeng . 2006，2 ⑻ 7) 有力地论证到. 
口『能的反事实耑要数据来界定。数据内部的反事实是可信 的； 数据之 
外的推断则存疑。数据必须提供现实世界中的例子•用它们进行反事 
实分析。换言之.一个个案在某个自变 M 上的反事实变化对于该个案 
的历史专家来说可能不会发生_但是，只要数据提供了良好的比较个 
案——基本 L 是匹配的个案——吋川来估计该变化产生的效应，那么 
这也不会太令人困扰。事实上，在定量传承中•人们吋以说，任何给定 
的反事实都取决于该反事实距离观测数据朽多远。 

9.3.2 定性步骤与最小重写规则 

在定性传承中.典型的反事实是关于一个特定——通常在历史上 
重要的——个案的一种声称。有人问，如果原因 X 在一个实际感兴趣 
的个案中取 r 不同的值，那么某个给定的结果 Y 会怎样变化。研究者 
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会想象这个原因事件不发生（或以不同的方式发卞），并探索结果是否 
仍然会发生(或以 M 样的方式发生）。①在反事实假设中•通常将结果设 
定为一个结果的缺失或否，而非关于一个特定的正向结果的精准 M 测 
(参见 Fearon ， 1996)。在许多例子中，原因 X 是个小事件•但它被认 
为具有重要的后果•虽然不完全如此。 

定性研究与特定的反事实个案的分析有着天然的联系。如果有人 
提岀， X 是一个特殊的个案中 Y 的成因.人们自然会询问，如果 X 有所 
不同•将会发生什么。事实上•如果认为 X 是 Y 的一个必要条件，该假 
设要想成立，那么 X 的反事实缺失必然带来 Y 的缺失。同样.《 I •:个案 
层次中. INUS 的缺失通常会导致结果的缺失。@ 

不出意外，在进彳 f 反事实分析时•如何使因果推断的影响力最大 
化，定性方法论者在这方面引领着相关的讨论。至早吋追溯到韦伯 
(1949), 学者 提出了 ••最小重写 ” 原则 （“minimum rewrite” rule) •认为 
反事实应该要求尽 "I 能少改变已知的历史记录 （ Stalnaker ， 1968 ： 104 ： 
Elster, 1978 ； Fetlock and Belkin, 1996b ： 23 25 ； Reiss. 2009 )。 在 

已知某个案的特征的情况下，反事实的先行条件必须吋理解 并且看 I : 
去可信。要基于关于特定个案和宽泛理论方面的知 i 只和来自其他研究 
领域的普遍发现来评价可信度。应该避免“奇迹”式的反事实先行条 
件。通常来讲，最可能的反事实先行条件涉及“小”改变（例如•假设一 
位领导人未被喑杀），这也是为什么定性研究者作进行反事实分析时常 
常考察小事件的原因 （ Fearmi . 1991：193) 0 类似的是•反事实的结果 
通常必须在一个“可能的世界”中发生，该世界不会完全不同于现实世 
界(参见 Lewis , 1973) 0 如费伦所说，“当我们试着解释为何某个事件 
/《发生的时候，会潜在地设想有一个对照空间•在这个空间里没冇 K 
其余部分则与 B 存在的世界相似” ( Fearon ， 1996:57;参见 Garfinkel , 
1990)。 


①有 时候. 研究•会芩察一个否， ( 例如•不发牛.战卞）•此时所谓的反如实就指 
的 是一 个正向事件 (如 战争 ） B 

2) 存一个例外是这样的情况 - 即其结果是由多重充分条件构型 (multiple sufficient 
condition configurations ) 的存在而由多因索决定的 
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好的反事实能够引导定性研究者，帮助他们指定证据.以便在解释 
特定的结果时与过程追踪一起使用（参见第8章）。例如•人们可能反 
事实地提出假设,认为如果戈尔（而非布什)赢得丫 2000年的总统大 
选，美国将不会发动伊拉克战争（参见 Harvey， 2012)。从历史角度 
讲，这个反事实貌 似川倍 • 它提清我们注意到个体领导人/十:推动外交政 
策I:的影响。它引导研究者进一步考察布什和戈尔的差异，并区分出 
布什有哪些独特的信念和抉杼最终导致战争决策。这也激励分析者考 
虑到备择的论证，例如系统性的 化力 会使得即使义尔当选总统 lli 会命 
令美国攻击伊拉克。相比之下，下 Ifli 这个假设就不是非常有用了 ：如果 
特蕾莎修女（而巾布什) M 得丫 2000年总统大选，美国就不会发动伊拉 
克战争。如果 III: 界没有彻底的改观，这种事件的发生就足不 "J* 想象的. 
并11这种分析提供的指针太少了 • W 而 不能区 分出到底布什总统的领 
导力的哪个方面对于战争的发动来说是关键。 

如此看来，我们找到了定性与定量研究中提岀的典型反事实的根 
本差异。前一种传统提出的反事实遵循着最小重写原则.汴 U. 从历史 
角度 讲对于 正待分析的个案来说是 "r 能的。这个标准扛接遵循着这样 
一个事 实:定 性研究者试图用反事实分析对一个特定的历史个案进行 
因果推断。相比之卜、定 M 传统屮的学#则提议那种涉及最大重写原 
则的极端反事实。这样做的原因作 -P 他们将反事实用于模型分析和解 
释目的，并非因果推断。 

9.3.3 什么是合理的反事实？个案间与个案内的回答 

金和曾 （2007) 在一篇重要文献中指出•定量研究屮 nj ‘能有一个反 
事实•即数据集合中有一些个案与所提议的反事实相似。他们(像一些 
哲学家那样)不讨论最接近的“可能的[II:界” （possible worlds). 而关注 
在数据中发现的最接近的 真实世 (actual worlds) (参 1 Al Mikkelson, 
1996) 。 3 数据不支持这些反事 实吋， 他们便批判。其中的一个例子涉 
及加拿大的国家失灵 （W 变 量）： 
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我们的第一个极端反事实是，假定加拿大在1996年成为一个 
威权政体•但是它的其他变量值仍然是实际值。如所期望，我们发 
现该极端反事实处在观测到的数据（在控制变量上的）凸包 
(convex hull ) 以外•因此需要外推。换言之，我们固然可以追问如 
果1996年加拿大成为威权政治会发生什么，但我们不能用历史作 
为引导，因为与加拿大在其他可测的特质方面相似的威权政体的 
实例在世界上是不存在的。 （King and Zeng ， 2007: 192) 

金和曾用跨个案的术语界定了一个可能的反事实。如果有其他个 
案与反事实相似，该反事实就是合理的。 

相比之下，定性研究中运用的最小重写原则是一种个案内 （ within - 
ca se ) 的观 念:对 于个体个案来说•反事实提议是杏可信？例如，加拿大 
{£ 1996年推行威权政治•这个反售实就不合理•因为它违反了最小重 
写原则。要彻底改变加拿大的历史才能得到这个反事实的先导条件。 
呻然，人们可以用一些跨个案的证据来评估个案内的反事实•但是对其 
介理程度的判断最终还是一个个案内的决定•它作很大程度上依赖于 
分析者拥有的关于该个案及其历史的知识。 

为了进一步探究这种观点，我们可以考察有多大可能性去发现这 
样的个案，即从完全威权变成了完全民主。例如，对于政体数据 x 来 
说 ，一 个国家在相对较短时期内冇多大可能从一 10( 威权主义）变成10 

秦 

( R 主)？统计的回答是截面式的 ：有没 有哪些围家的政体值 （Polity 
value ) 是10及 一10 •但在其他变量 h 相类似?《定性研究则涉及个案内 
分析: 这种变化对于一个特殊个案米说有多大的"〖能性？定性研究者 
不完全依赖于类似的实际个案能杏被发现(虽然这条信息通常有一些 


X 政体数据系列 （The Polity data series ) 是政治科学中广泛使用的数据库，其最新版 
小足政体数据第四版，它包括 f 所有人 [ I 数大于50万的国家1800 2013 年间每 -年的民 
主稈度信息编奶值^计对每一年的每个 H 家汁算其政体得分 （Polity Score )：-10 到一 6 
对应的是专制政治，一 5到5对应半民主 . 6到10对应民主,，其网站参见 http ：// www . 
syst eniici ) eace . org / polity/polit y 4. htm 0 译者注 

①事实 h •这类 W 人改 W 并不被 数据支 持。政体数据表叫家有吋能在一段相对 
较短的时间内从 1() 分增加到15分，似是不可能完全到达20分。 
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作用）。某个蓰于截面数据 I :的反事实可能注定是不可信的•怛一旦定 
性研究者针对一个特定个案来分析时•它却可能是可信的。定性研究 
者也可能基于个案内知识认为一个反事实是不可信的•即使该反事实 
不能通过截面式的统计数据所排除。® 


9.4 结论 

在定性研究中，反事实分析居于个案内因果分析的核心。对于个 
案研究来说.反事实分析是研究 t 在评价假设时与过程追踪法共同使 
用的一个主要工具。他们在反事实的假定下重演一个个案的历史•以 
便决定一个既定的因素是否发挥了它假 设具苻 的因果作用。这些反事 
实实验的结果能够强烈地影响到由个案间分析所产生的结论。 

虽然反事实在统计学传承中指引着因果性的定义（参见第6章）， 
处于该传承中的研究者通常还是不能着手历史个案的反事实分析。他 
们选择的是总休中（潜在地假设的）代表性个案，而不是特別关注的个 
体实际观测值。他们不用理论和已有的发现来重现历史，因此并不判 
断如果某个个案在一个原因变量上取了不同的值，将发生什么后果。 
相反•在这种传承中，表达反事实的目的是解释统汁估计的结果 •做出 
有关因果效应的普遍论断,， 
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業三部 B 腿蔻与测量 





概念： 定义、指标与误差 


事物的本质在于 . 没有它•该事物便既不成立，也不能认为 

它成立。 

—— J . S . 穆勒 ( J . S . Mill ) 
总之•可以尝试用一个既定的指标对某个系统化的概念进行 
操作化•当从该指标中引出的一些值可以依据此系统化概念进行 
有意义地解释的时候，测量才是有效的。 

-罗伯特 • 阿德科克 （Robert Adcock ) 

戴维 • 科利尔 （ l ) avi(l t ' ollit * r ) 


10.1 导言 

从事肴两种传承研究的学荇们采用不同的路数米处理概念化和测 
M 问题。 K • 中一些路数之间的差异 + 是特別令人惊 W 。 定性学者 V •已 
就概念的意义进行了长期、集中、 “ 冗长 ” 的讨论。就此而言 • 他 ff 】像(政 
治 ) 哲学家 . 也在概念分析上花费大量时间。相比之下•定量学者的统 
计模型则需要数据。闪此，他们集中关注定量测 M 的质和 M 。他们在 
概念上耗时较少 • 在操作化、测量和得到的数据集 t 费时较多。 

本章关注有关概念化和测量的定量和定性路数之间的两个重要区 
別。第一个 K 别涉及的问题足 • 将概念界定或概念测卩!:中的哪一个赋 
F • 相对重要的地位。定性研究者最关注定义问题及其概念的意义。他 
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们通常接受语义学的路数 • 努力确定哪些界定性的属性构成 / 一个概 
念的固有本质。相比之下，定量学者的关注点主要放在潜变量的测量 
上。他们寻找与所研究的潜变量有关系的优良指标。 



有极值 ( 如那些接近理想型）的个案时 • 会感觉到最有把握。他们对那 
些其取值在全域 (range) 中间的个案最无把握。相比之 F ，定量研究者 
对有极值的个案最没有把握 _ 对接近均值的个案最有把握。在这两种 
传承中，将定义和指标中的哪一项赋予相对重要的地位•这一点与上述 
差异是相关的。定性研究者将数据与定义匹配起来 ，闪而 ，对于那些其 
定义显然与数据匹配或不匹配的实例来说，定性研究荇最有 61 信。相 
比之下，定量学者使 ffl 的是指标，对于那些其取值远离作为一个整体的 
总体中典型值的个案来说，他们最不自信。 


10.2 对特征及指标的界定 

在定性传承屮，关于概念的 H 论和争论涉及语义学，即涉及概念的 
意义。在追问并讨论概念的定义是什么的时候，一个完全标准的问法 
就是追问其意义。例如，有人 rl j 能会问， “ 你对福利 M 家的定义是什 
么？ ”一个典咽的定性回答是给出一张构成该概念的属性或特征的列 
表。这个做法没什么太祌秘之处，因为它基本上就是词典所为之事。 
词典和定性传承都试图设定一个词条的本质特征。现有来自哲学的一 
个常用例子，关于 “ 铜 ” 的一个好的定义会给出其化学特征，这些特征描 
述了铜 的性质，包括仟意一些因果力 （causal powers ) 。 

在定量传承中，关于概念的讨论和争论集中在数据和测量问题上， 
很少关注语义学和意义。虽然关于概念界定的讨论对于收集此概念的 
数据来说通常是必要的，但是它并非关注的焦点。在有关定量测量的 
文章中 4 既念部分甚至根本不存在。相反，研究者关注的是概念的操作 
化和测量。操作化通常包括发现一些由数值数据构成的指标•这些指 
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标要与不可测量的潜变量有关。一旦找到这样的指标，就可以利用简 
单或复杂的测量程序对个案进行编码。这些测量程序的范围从简单的 
相加到复杂的贝叶斯式潜变量模型。聚合程序或测量模型会生成与所 
研究的概念 ( 变量 ) 相关的个案得分。 

作为此类定量方法的一个例子，可以考虑 Cx I D 恐怖主义数据库 
(CETIS, 2007)' 该数据库目前经常用在恐怖主义的统计研究中。众 
所周知，恐怖主义是一个有疑问的概念（参见 Schmid and Jongman, 
1988 给出的几十种定义）。阅读 （ ;TD 编码本可见 •导言 部分清楚地承 
认此概念的不确定性，但是儿乎所有的编码本都与数据相关。一旦承 
认此概念难以定义 . 定义问题就不在考虑之列了。在不参考定义问题 
的情况 K • 要继续 i 、 [ 论数据。事实上，要想区分恐怖主义的实际的 
GTI) 定义，必须阅读附录。 

定性学者并 + 需要大量的个案数值数据，他 1 自由地 i 、 J * 论概念及 
其界定性的 M 性。这种自由的 • 个危险在于增加 f 概念的复杂性。定 
性的定义可能很长、难懂，甚至存拜占庭式的特征 （Byzantine in char¬ 
acter) 0 我们青睐的一个例子是施米特 (SchmitRT) 给出的关于法团主 
义 （ corpora t ism ) 的有影响的 定义 : 

可以将法团主义足义为一个利益代表体系，在这种体系中，其 
构成单位 (constituent units) 被纳入少数几个单一性的、强制性的、非 
竞争性的、有层级秩序以及按功能区分的范畴类别之中，它们得到 
国家的承认或许可（如果不是由国家创造的话），并在各自的范畴类 
别中享有垄断的代表权•作为交换•它们在领导选择以及需求和支 
持的表达方面接受国家的某些控制。 (Schmitter, 1974:93— 94) 

这个定义有很多不同的属性 • 其中一些包含在其他属性之中。如 
采有人试图将施米特的定义分解成个体的特征 • 其中可能存在 1 () 个或 


* (;TI) 是令球恐怖主义研究数掘库 (( ilobal Terrorism I )atabasi ) 的缩写•它是一个开 
放源代码的数据库网站，这里 i 己录/从1970年到2013年世界各地的恐怖牛信息，并11 
f 断更新各种恐怖事件.其网址参 f Al Hup ： // www.start.unui.edu/gul 0 if •者注 
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更多的特征。此外•不同的人4能给出不同的列表。 

在定量传承中，对有关法 W 主义数据的编码过程涉及指标的使用。 
这些指标可能在概念的定义中没有明确地提及。例如，劳 I :集中势 
(labor centralization ) 被用作法 • 网主义的定摄指标（参见 Kenworthy. 

2003对其他定 M 指标的讨论）。至于该指标如何符合施米特的定义屮 
的抽象语言•则是一个需要解释的问题。 一 般来说•从概 念到具 体数据 
的变化将 ) L f •总是涉及显著的简化。通常这种简化隐含着耑要重新定 
义一个 概念. 使之包括更有限的定义维度。 

对定性研究 荇而言 .指标如果不能很好地代表一个概念的全部界 
定性的属性•这就值得关注了。对于这些研究各 Ifl 了言 •一 个概念的诸多 
属性都是那些真正构成此概念的必要特征。因此，每一个属性都要测 
量。定性研究者拒绝极端的简化模式。他们相信，对概念的界定必须 
独立于对数据的考虑。一个概念的定义不应该受到 H ]* 测 M 此概念的数 
据的驱使。 

与构成一 '个 概念的诸多 )/4 性4、 M 的是，定 M 指标是 n r 选、皆换 
的，未必是定义性的。不同的指标都是同一‘个概念项的测度。特赖尔 
和杰克曼 （ 1 rc、icT mul Jackmnn. 20()8) 对民 4 ‘:的政休测度 （ Polity meas- 

ac ) 很好地展示了界定性的属性和指标之间的差异。政体数据从5个 
属性角度来定义 K 主.它认为每一个属性都是 Wfe 的内在特征。然而 • 
对于特赖尔和杰克曼来说•这吟属性无非 是潜化 的民主概念的指标而 
已。在这5个指标中.有2个不符合他们的方法论的统汁要求 . W 此被 
丢弃。因此，他们最终的民主测度只用了 5个政休维度中的3个。 

因此•定性研究者所给出的界定性特征对于定 M 研究#来说 吋能 
是一个指标。另举一例，博伦和格朗让 （Bollen and ( irandjeans . 198]) 
使用选举的公乎性作为政治民主的一个指标。对定性研究者而言•公 
平选举经常被#做民主的一个界定性的固布厲性。它不是"〖选 的:这 
个属性对于民主来说是必要的属性 (Bowman et al . ，2005; Mainwaring 
ct al . • 2001 ) o 

在讨论概念的定性文献中•指标的语言通常被诸如一种 K 主的最 
低要求这样的语言所替代。一个好的例子是科利尔和列维茨锥关于缩 
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减子类 (a diminished subtype ) 的有影响力的见 解：“ 例如，将‘有限选举 
民主， （ limited-suffrage democracy ) 和‘监护式民主 ’ （tutelary democ - 

racy ) 都理解为不完整的民主个案，因为它们缺少民主的一个或多个界 
定性属性 。” （Collier and Levitsky , 1997: 436—437) 如果源概念 （root 
comxpO 的诸多属性具有备选性，对于该源概念中的概念成分资格来 
说不是必要的，那么缩减子类思想恰恰意义不大了。 

一个相关的差异涉及定性研究中的属性/概念与定量研究中的指 
标/变量的对比。在定性传承中，属性和概念之间有语义学的、概念上 
的关系。在定量传承中，指标和潜变量之间是一种因果关系：用标准眼 
光来看，潜变量产生了指标 ( Bollen ， 1989)。① 



资料来源 : Bo lien and Grandjean ， 1981 0 

图 10.1 关于政治自由和主权在民 （popular sovereignty ) 的潜变量模型 

图 10.1 展示了一个典型的潜变量模型。图中的因果箭头从潜变 
量指向了指标。这有助于理解这样的想法，即指标是可替换的因素。 
潜变量可能是许多不同事情的起因，学者只选出其中的一些。如上所 
述，当研究者将这些指标看成是界定性属性的时候，就会产生跨越两种 
传承的张力。在定性传承中，界定性属性不能与感兴趣的概念有因果 
联系;它们甚至不能从时间上与概念分离。它们就是概念。 


①对因果箭头的建模也可以取另一个方向（如 Bollen and Ting , SOOCOjM 是这种情 
况很少见。 


1 S3 













两种 传承： 社会科学中的定性与定量研究 


测量应该建立在因果理论的基础之上，这种思想已有长期的、有名 
的历史。亨普尔 （ Hempel ， 1952) 用自然科学作为其关注点，给出了这 
种联系。例如，温度汁之所以能测量温度，其有效性取决于热膨胀的因 
果理论。在社会科学中.同样的想法也支撑着众多关于潜变量和测量 
的文献 (Bollen ， 1989)。我们的目的不是质疑这样的观点，即指标和潜 
变量应该因果相关。在定量传统中，对于很多现象来讲，这种见解完全 
可以理解。相信一个人的智力——潜变量——可能影响其在智力测验 
上的表现，这看起来是合理的。同样，一个人的政治意识形态可能影响 
其对政治问卷的回答，这看起来也说得通。 

不过，从定性的立场看,关键问题仍然是解决所关注的概念的意义 
问题。这些研究者将通过追问“到底什么是智力（或政治意识形态）的 
定义”而向定量学者施压。概念可以根据用来测量概念的指标来定义 • 
他们会对任何此类回答都不满意。©从定性的视角看，指标的性质必须 
总要用正在测量的概念的意义维度来评估。很多定量研究者会在原则 
上同意这一点，但是这种传承中的关注点将讨论引导到更集中关注测 
量和指标问题，而不是关注意义和定义问题。 


10.3 误差 

当对个案进行编码时，在对待我们的知识的性质方面，定性和定量 
范式展示了重要的差异。在一种传承里被认为是可进行精确描述和编 
码的好个案通常在另一种传承里被认为是不好的。定量研究者假定的 
那些有高度测量误差的一类个案，恰恰通常是定性研究者假定的有最 
小测量误差的个案，反之亦反。 

为了探索这种差异，我们可以先澄清“误差”(它是所有统计学的中 


①操作主义教条认为，概念的含义要在用来测量它们的指标和方法中寻找。大多 
数哲学家和社会学家都反对这一教条 a 
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心)和“模糊性” ( fitness ) (它在定性研究中是一种重要的想法)之间的 
关系。这两个概念初看起来可能很相似。当定量研究者听到“模糊的” 
这个词的时候.他们可能最开始相信它暗含着缺乏精确性，进而意味着 
“不确定性”和“误差”。但是事实上，将“误差”和“模糊性”进行类比是相 
当误导人的。这种对比是统计学和模糊逻辑学之间转译问题的一个 
实例。 

在统计学中，误差估计涉及我们的知识性质。的确，统计学之所以 
不同于关于世界的其他数值估计方式，恰恰在于它包含着一种随机元 
素，从而允许对我们的估计量的精确性有所评说。相比之下，模糊集成 
员值 ( luzzy-set membership values ) 是对世界特征的陈述。比如，如果 
某人说一个个案的模糊集成员值是0.75,他就是在宣称该个案具备的 
一个经验性质——即此个案主要但不完全隶属于一个给定的概念集 
合。关于误差和知识性质，人们不做任何假定或陈述。这样的宣称在 
任何意义上都不是概率性的。 

一个更好的类比是，个案在模糊集合中拥有其得分，它可比拟给定 
的一次观测所对应的变量在一个定量数据集合中的值。尽管模糊集合 
的隶属值和变量值不能机械地相互转译(参见第12章）•但是二者是对 
应的。一个大的区别是，模糊集合的隶属值通常不存在与之相关的误 
差估计值或不确定估计值。在模糊逻辑数学中，的确存在着“二级”模 
糊性 (“second order ” fuzziness ) 观点 :我们 的模糊隶属值又在多大程度 
上是模糊的（如 Klir and Yuan , 1997； Arfi ，2010)? 这种二级模糊性 
从性质上讲可以很好地与误差估计值类比。然而，虽然在模糊逻辑文 
献中存在着这样一种数字选项，但是在定性传承中它可不是一件自然 
之事，它实际上很少应用在社会科学实践中。 

尽管定性研究者没有给出明确的误差估计量，但他们的确时常讨 
论在对特殊个案进行精确地编码时遇到的困难。困难可能包括详尽地 
讨论针对个案的某些编码背后的推理。他们可能将决策建立在已有的 
文献或他们自己的专业知识基础之上。从定量的视角看，这些研究者 
会非常担忧少数个体观测值的特殊编码，这可能令人奇怪。在定量传 
承中，将时间和资源放在少量有问题的观测项通常不是一个好的投资。 
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在决定这些定性编码的时刻，通常要评定一个个案在多大程度 h 
符合一种“理想型”或一个给定概念的纯粹的完备实例。这个理想咽可 
以作为一种标准•依据它评估所有的经验个案•学者根据这个标准来 
“校对” ( Ragin ，2008) 他们的个案编码。从模糊集合的成员得分量表 
方面讲•理想类型居于量表的一极 ：理想 型个案的成员得分为1。这些 
个案明显拥有所讨论的概念的全部界定性特征。 

在这种定性路数中有一个总的直觉是，个案越接近理想型，越容易 
编码，因此，与这些编码相关的误差也小一些 （ Eliason and Stykcr , 
2009； Ragin , 2 ⑻ 8)。 同样，得分为 0 的个案通常也易于编码，因为某 
个因素在什么时候根本就不为一个概念所包含•这通常是很清楚的。 
相比之下，模糊集合得分为 0.5 的个案展示岀最大的模糊性，特别难以 
编码。因此，从模糊集得分为1的理想型转到最大模糊度().5,精确地 
编码的难度增加•误差更可能出现。从得分为 0.5 再移到极值0,编码 
就又变得容易了，误差普遍减少。闪此，在实践中，在模糊水平和误差 
水平之间通常大致有曲线关系。这种关系因情况而定•它取决并依赖 
于正在被测量的特定现象，但我们认为它可能至少在社会科学情境中 
是相当普遍的。 

在统 计学 传统中•变量值和误差之间的关系遵循反向模式。对于一 
个连续编码的变量来说•如果询问最大的误差估计将发生在哪里，统计 
学给出的答案是发生在有极值（即最高或最低）的个案屮。误差在一个 
变量的上界和下界处最大,在中间最小。学生早在接受统计学训练、考 
察围绕回归线的置信带 (confidence band ) 的时候，就了解这种关系了。估 
计的误差在 X 的均值及7的均值处最小。距离中间点越远，误差越大。 

关于统汁学传统中变量值和误差之间的关系，一个好的例证是特 
赖尔和杰克曼 （Treier and Jackmaru 2008) 的民主测量模型。正常情 

况下，在一个定量数据库-如政体数据或自由之家数据 （ Freedom 

House )" ——中，对民主的编码不包括任何明确的误差估计。例如，一 


* “自由之家” (Frecdom House ) 是由 J 6 0政府资助的一个非政府组织，建立 p 1911 
年•它支持关于民主、政治0由和人权的研究，并发市这些方面的研究报告。——译荇注 
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个个案可能有一个民主得分为3,另一个得分为6,但是与那些值有关 
的误差项没有被估计。特赖尔和杰克曼的模型为这些估计提供了一个 
基础。图 10.2 呈现了特赖尔和杰克曼针对政体数据给出的民主测度 
误差估计值。我们从中看到了经典的置信带形状：中间最窄，两端 
最宽。 


-8 -6 —4 —2 0 2 4 6 

民主水平 

资料来源： Trdur and Jackman. 2008 ： [¥| 2 0 

图 1<>.2 统计测量中的误差展 示：民 主水平 

从定性观点来看•针对民主的这些误差估计值看起来违反直觉。 
对完全民主的或者明显不民主的个案的编码通常是容 易的； 处在中间 
地带的个案难以编码。每个人都同意，瑞典是充分 K 主的国家，朝鲜显 
然是不民主的国家。但是，我们戍该怎么对处在边界线上的个案（如危 
地马拉、委内瑞拉和洪都拉斯)进行编码呢？ 

在探究这个问题的时候•一种方法是询问荷关民主的不同数据集 
之间的一致程度。可想而知，这些数据集会在易于编码的个案上趋于 
一致，在难以编码的个案上趋于分歧。“政体数倨”和“自由之家”数据 
编码冇重叠，在阁 1 0. 3中，我们利用国家 - 年代格式 （ count ry-ycars ) 报 
告了这两个数据编码的方差(细节参见 Goem 2008 )。 当这两个数据 
集完全一致的时候•它们之间的方差为0。随着二者的分歧增加，它们 
之间的方差也在加大。在图中•我们清楚地看到•在威权政体和民主政 
体这两极（即一 10和 10) 方差 最小； 也就是说，当政体编码和自由之家 
编码都是一个极端威权值（得分为一 1()) 或完全民主值（分数为10 ) 的 


5 


误差幅度 
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“自由之家”数据的民主程度（已转换，全距为一〖0到 10) 

图 10.3 自由之家和民主政体量表的方差 

对比图 10.2 和图10.3,可以生动地展示两种传承及其关于测量误 
差位置的不同观点。图 10.2 是定量研究者通常期望发现的，图 10.3 是 
定性学者认为要发生的。 


10.4 结论 

本章讨论了推动定性和定量传统的概念和测量的不同方式。在定 
性传统中，总体来说，概念是通过一个语义进程建构的，其中研究者要 
确定构成一个概念的属性，据此来定义此概念的意义。当在这种研究 
中测量个案的时候，如果它就所研究的概念来说有极值，那么定性学者 


①读者可自行重评普沃斯基等人 (Przeworski et 吐，2000:58 59) 的论证，即如果 
误盖有着如图 10.2 所示的方差，汴且民主和威权之间的分割点足0,那么他们对民主的二 
分编码产的误及就小 -T •个连续测度 的误义 


时候，不一致性就很小。随着我们移向中间的灰色地带 (0 分），可以看 
到对一个给定的国家-年代编码中的变异在显著增加。事实上，随着我 
们从10分下移到0分，方差增长近1 000倍(从 0.025 到22.6)。当我 
们从极端威权值(一 10) 上移到0分，也发生一个大的变化，尽管增长幅 
度仅有10倍。 ® 

301 I -1 


o 


o 


LO o 5 o 5 0 
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政休数据的方差 


15 S 




10 槪念： 定义、指标与误差 


对这样的个案最有自信。因此，当他们考察的个案明显是或明显不是 
所研究的概念的实例时，便发现其测量是最简单的。当个案变得像所 
测量的概念的模糊实例时，误差易于出现。 

总起来讲，在定量传统中，要通过区分出指标来建构概念，这些指 
标是由所研究的概念引起的。出于各种统计学原因，误差估计值在均 
值上比在极值上 要小； 如此看来，定量学者对有极值的个案最没有把 
握，对接近均值的个案最有把握。 

每一种传承的独特取向都有其合理性，各自都有长期的历史和背 
后的良好的方法论辩护。它们与这两种传统的个案取向对总体取向的 
本质密切相关。然而，这些根深蒂固的差异使它们之间难以（尽管不是 
不可能)通融，达到对概念和测量的一种综合的研究 （Adcock and Col ¬ 
lier , 2001)。这有助于解释为什么关于概念的定性文献和关于测量的 
定量文献并没有更多地互评。 
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11 

1 -JL 意义和测量 


在关于定量及其承载的标准逻辑规则的这场混辩中，我们简 
直忘记 了：概 念的构建先于定量。 

- 乔瓦尼 • 萨托里 （Giovanni Sartori ) 


11.1 导言 

不同的学术传承通常有不同的方法论词汇。一种传承中的学者可 
能假定能够运用他们已有的词汇来理解来自其他传承的概念，尽管如 
此，转译问题事实上经常会出现。在自然语言之间进行转译时 ，一 个既 
定的词或观点有时候不能用另一种语言完全表达出来。同样，在社会 
科学中，当相同的术语被用在跨度不同的方法论传承时，它可能有不同 
的意义或有不同层次的重要性。一个概念在一种传承中是核心，在另 
一种传承中很可能仅得到少量的关注。 

在本章中，我们针对与概念和测量有关的问题，探索这些转译问题 
是如何体现在定性和定量传承之中的。在定量传承中，人们谈及的是 
变量和指标。 X 和 Y 通常是潜在的、未被观测的变量，需要（定量的) 
指标来测量。例如，可以考察“经济发展”这个变量。尽管该变量不能 
被直接观测，但它能用一个指标，如人均国内生产总值进行经验地测 
量。在实践中，定量传承中的学者可能将变量和指标融为一体。例如， 
他们可能交替使用经济发展和人均国内生产总值。然而，基于本章的 
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目的，我们应该令变量及其指标保持相当的分离。当我们说“变量”的 
时候，指的是一个有理论旨趣的潜在构念 （ latent construct ) ； 说“指标” 
时，指的是测量这种潜在构念的数值数据。 

定性学者缺少讨论这些问题的一种统一的方法。出于方便，或由 
于统计学课程和主导性词汇的存在，他们太经常使用变量-指标语言 
了。然而我们相信，这种语言在定性传承中会引起一个转译问题，并且 
不能把握研究实践。我们不从变量和指标的角度来讨论，而需要通过 
区分概念和数据来把握定性传承。所谓“概念”，我们意指一个范畴(或 
集合），其中的个案有隶属资格，包括不同程度的资格。例如 ，一 个标准 
的定性概念是“经济发达国家”。所谓“数据”，我们指的是性质和数量 
各异的信息，它们被用来评定个案是否或者在多大程度上成为概念的 
成员。一方面，在“变量”和“概念”之间有一个明显的类比，另一方面， 
在“指标”和“数据”之间亦然。概念和变量是词汇及相关的观念，可用 
它们来明确地表达理论，而数据和指标都是经验的信息，使用它们去测 
量概念和变量。 

虽然变量-指标和概念-数据大体上看似是同一事物的两种说法， 
事实上它们指的是不同的关系。本章的标题“意义和测量”即总结了这 
些差异。对于定性学者来说，概念和数据之间的关系是一种语义学的 
关系，即意义。这些学者探索了如何用数据来表达一个概念的意义。 
相比之下，对于定量学者来说，变量和指标的关系关注的却是变量的测 
量。这些学者关心的是如何用指标来最佳地测量一个潜变量。 

举一个例子，现在再一次考量如何用人均国内生产总值数据来分 
析经济发展。在定量传承中，一个标准的步骤是说.一个国家的人均 
GDP 是其经济发展水平的一个好的指标。人均 （; r ) p 数据进而变成经 
济发展水平的实际测度被用在统计模型中。定性研究者在分析经济发 
展时，可能也用人均 GDP 数据。然而，他们通常会询问，这些数据与其 
所“意味”的一个特定范畴(如经济发达国家)是如何关联的。数据在用 
于分析之前，通常必须经历我们所谓的“语义学转换”（参见 Ragin, 
2008关于“校准”的论述），如此才能更好地拟合研究者的核心概念，即 
经济发达国家。定量研究者在一个统计模型中分析人均 GDP 数据之 
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前 • 也可能对它进行转换（例如，使用经过了对数转换的数据 ） ，①但是 
这些转换将是因为统计原因被执行的(例如，由于有偏态数据）.而不是 
为了实现与概念意义的更好匹配。 

当在国家之间比较“经济发展水平”变量的最终数值测度 1 r 经济 
发达国家”范畴的时候，对于特定的国家往往会产生不同的特殊值。因 
此，两种传承中的差异对于学者如何编码和理解特定的个案来说具有 
直接、具体的意含。 

我们认为，模糊集分析是一种有用的工具，可用它来在形式上设定 
定性研究者考量概念-数据之间关系的方式。毕竟，模糊逻辑从起源上 
看是一种语义学的数学理论（关于它的通俗易懂的介绍•参见 Kosko, 
1993, McNeill and Freiberger, 1994)。 设计它的目的是解决与自然语 

言术语的建模有关的问题。经典的例子是诸如“高个子”和“富人”。对 
于这些概念，我们可能拥有关于个体的身高和财富的数据。模糊集分 
析提供了一套工具•这套工具用这种数据来说明个体在多大程度上隶 
属于高个子和富人范畴。 

在定量传承中，如果人们想评估一个关于高个子或富人的假设，就 
可能在统计分析中使用关于身高或收入的数据。虽然变量和指标不需 
要在概念层次上融合，但是在实践中，岀于统计假设检验的目的，这两 
者被看做一样的东西。定性学者在实践中也可能将概念和数据融合在 
一起，但是它遵循的是一种反常的程序。这些研究者倾向于进行一次 
非线性的语义转换，最终达至理解个休在多大程度上落入高个子和富 
人范畴内。 

另一个思考这个问题的方式是，定量学者典型地假定变量和指标 
之间有线性关系。在指标和变量之间有一个直接的匹配。显然，任何 
一 个指标都可能不是一个潜变量的完美测度，这就是为什么人们鼓励 
使用多重指标的原因。然而•也无须假定在变量和指标之间有一个非 
线性的关系。相比之下.在模糊逻辑内，语义学转换几乎从来不是线性 
的。虽然在模糊逻辑中大量地使用转换•但是•线性转换却根本不受 


①我们 ft 第12茕 i 寸论一些常阽的变换.如取对数。 
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欢迎。 

在定量传承中经常使用线性，可以通过考量一对对变量看到这一 
点，例如发展水平对不发达水平。这两个变量通常被看做恰好互 逆的: 
发达水平每增加一个单位，会引起不发达水平减少同样一个单位。发 
达和不发达是用同样的数据(如人均 GDP 数据)来测量的，这一事实强 
化了这种对称性。相比之下，模糊逻辑可能很好地为经济发达引发了 
一 个语义学转换，为经济不发达引发另一个不同（如果相关）的转换。 
结果是，在发达国家集里一个个案的最终隶属度将与其在不发达国家 
集合中的隶属度负相关，但是这种关系可能不完全对称。我们不能基 
于一个国家的不发达分值来必然预测其在发达上的模糊集分值。对立 
的一对概念有非同一性 （ nonidentity ) ，这个假定是标准的模糊逻辑立 
场，它在定性研究者中间非常普遍，例如，和平不等于不战争（参见第 
13章） 0 


11.2 语义学变换和集合-成员函数 

术语上的差异通常标志着方法论实践中的重要对比。在针对概念 
的模糊集合研究中，核心是“隶属函数”。为了便于展示，现考虑适用于 
描述人的“身高”概念。在模糊集分析中，人们询问一个既定的人在“高 
个子集合”中的隶属度。相比之下，在定量分析中，人们可能询问一个 
人在“身高水平”变量上的得分。为了对个案编码，定性和定量研究者 
都可能转向关于身高的数据。但是这种数据可能以不同的方式被 
使用。 

按照惯例，模糊集合变量的范围是从0到1，即[0, 1]。从严格的 
数学角度来说，[0, 1] 的限定是随意的，因为处在一〜到+〜范围内的 
任何值都可以被重新调整到[0, 1] 内。实际上，我们可以通过简单的 
变换将数据重新调整到[0, 1] 内。在将一个连续数据集变换到[0, 1] 
范围内的时候，最显著的方法是减去其中的最小值，然后再除以数据集 


166 




11 意义和测量 


的全距。这使得数据集中的最大值变成了 1，最小值变为0。从统计学 
上讲，这是一种线性转换，并且总体上对于统计结论来说不会有差异。 
因此，在许多情况下，从统计学的观点看这样做是无意义的。① 

就模糊集合的隶属性研究路数来说，它的一个理论和方法论特征 
是强行将全部数据转换到[0, 1] 内。虽然变量变换在定量研究中很常 
见(参见第12章），但它们经常完全是可选的。而在模糊集分析中，它 
们通常不可避免。 



图 11.1 语义转换 :线性 

图 11.1 描绘了一种图解数据和概念之间关系的方式。其中 X 轴 
为“数据”， y 轴为“概念”。这个图可以恰当地说明模糊集分析，因为研 
究者想要知道， x 轴的数据如何与 y 轴表示的概念的语义意义联系起 
来的。相比之下，此类图并不用来汇总统计分析中的指标和概念之间 
的关系。图 1 U 假定这种关系是完全线性的。当定量研究者不依据 
初始量纲来转换数据时，这就是他们给出的模糊逻辑解释。然而，在模 
糊集分析中，几乎从来不做这种从数据到概念的线性变换。 

反之，当将数据变换为隶属值的时候，语义学的模糊集方法考虑的 
就是概念的意义。例如，当将“高”这个概念应用于人的时候，研究者会 


①在一些社会科学以及在某些时期内，人们对标准化的变量有一种偏爱。尽管变 
量的标准化不改变实质的结果，但是它的确允许变量之间进行对比，因为它们都有相同的 
单位，即标准差。 
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考虑“高”的含义 ( Zadeh , 1965)。在探究“个子高的人”的语义时，一个 
简单的方式是追问身高为六尺三寸 （1.() 米）的人是不是高个子。一*个 
可能的回答是，“是的，他当然是高个子”。转化成模糊集术语的话，此 
人在高个子集合中就有 1.0 的隶属值。对于一个五尺七寸 （1.7 米）的 
人来说，可以问同样的问题。回答可能是他当然“不高”，这意味着他在 
高个子集合中的隶属值是0.()。那么，6尺 （1.83 米）高的人呢？这样的 
人是“某种程度上的”高个子。这个人在高个子集合中可能有 0.50 的 
隶属值。这些“半空、半满”的点在语义学变换中是临界点。 

0.50 这个隶属值大致类似于中位数或均值，因为它代表一个中间 
点。然而，实际上， 0.50 隶属值的运作方式完全不同于统计均值。在模 
糊集逻辑中 ,0.50 隶属值是一个“交叉 ”点: 诸多个案从较大程度上属于 
集合到较少程度属于集合要经过这个点（反之亦然）。它也是这样的区 
域，即其中数据的小变化可能意味着大的概念差异（参见下文）。 （).5() 
隶属值与数据的分布无关。大体上，人们在模糊集分析中几乎从来不 
将数据的均值作为 ().50 水平。例如，虽然一个六尺高的人在高个子集 
合中可能有 ().50 的隶属值，但此人在平均身高之上。 


11.3 次要变异原理 

图 iu 呈现了一个线性的语义转换。事实上，在许多统计分析中 
将指标与潜在的变量联系起来的时候，这种线性变换是默认的步骤。 
在本节中，我们考量在定性研究中将数据与概念连接起来的一些常见 
的非线性语义转换。 

我们针对“高个子”构造的隶属函数的方式可作为一个例子。我们 
说一个六尺三寸 （1.9 米）的人完全隶属于高个子集合。那么七尺 （2.1 
米）高的人呢？此人显然会被认为完全是该集合中的一个成员。事实 
上，任何超过六尺三寸的人都是一个完全的成员。当然，同样的分析也 
适用于低于五尺七寸 （1.73 米）的人 ：他们 在高个子集合中的隶属值为 
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图丨 1.2 语义 转换: 次要变异原理 

或许有人问图 11.2 中的那些隶属分值幵始上升和下降的点。这 
坚分界点不是“任意的”吗？ 一 个合理的回答可能是，当研究者、政治 
家、著名的政府间组织（如联合国和世界银行）提到经济发达国家的时 
候•他们必定言有所指。如果他们确实言有所指•那么原则上人们可以 


0。这意味着，高于六尺三寸或低于五尺七寸的变异相对于高个子概念 
来说没有语义学的意义或重要性。 

现在，我们可以陈述在定性传承中的一个基本的语义转换 原理： 

次要变异原 理：在 数据中存在着拥有相同语义学意义的一些 

区域。 

至于个案在多大程度上隶属于语义学范畴，数据中的变异不会总 
能转译为这种隶属程度的差异。不同身高的两个人可能都完全属于高 
个子范畴。 

图 11.2 利用经济发达国家这个概念和关于人均 GI ) P 的数据提供 
了一个例子(参见 Ragin ， 2000给岀的类似的例子）。人均 GDP 上的 
差异（比如瑞士和瑞典之间的差异）并没有体现在它们隶属于经济发达 
国家集合的程度差异上;它们的隶属度都是1.()()。类似的是，大多数落 
后国家之间的差异都不能改变它们在经济发达国家集合中的 （） 隶 
属度。 


0 8 6 4 
• ■ ♦ ■ 
1 o o o 


2 


经济发达 H 家 


169 




两种 传承: 社会科学中的定性与定童研究 


解码其意义，并用它作为基础来决定数据从哪里开始反映重要的语义 
变异。因此.有关这些分界点的选择无须是任意的。另外，只要直线的 
斜率是适度的（尽管斜率常常相对比较陡）•隶属函数到底从哪个点幵 
始下降可能就不那么紧要了。 

关键点是相当直观性 的：在 顶部的4 000—5 000美元的差异根本 
不要紧，但是同样的差异出现在中部可能就非常重要。这导致了次要 
变异原理 （Principle of Unimportant Variation ) 这个推论，也可称之为 
小异大效原理 (the Principle of small differences but big impacts )。 人 
均 GDP 的差异对于经济发达国家集合的成员来说无关紧要，这个差异 
有一个范围。与此范围类似，还有被这些差异放大的范围。放大的差 
异岀现在小于]和大于0的隶属值之间。在这里，人均 GI ) P 上的小差 
异被转化成经济发达国家集合的隶属值中的大差异。 

在图 11.2 中，虽然直线的斜率对于 Y 轴上所有大于0且小于1的 
隶属值来说是恒定的•但它不必用模糊集分析这种方式进行精确地转 
换。在定量传承中.如果默认的语义变换是线性的，那么在模糊集分析 
中最受欢迎的选择就是 S 曲线的某种变体（再次参见第12章）。依据 
确切的 S 曲线•可以 在不同 的地方发现放大的影响域，尽管它通常围 
绕在 0.50 隶属值周围。简而言之•次要变异原理通常运用于数据范围 
顶端和底端•隶属值是0或1。相比之下，变动的效应在 0.50 隶厲水平 
附近被放大，此处数据范闱内的小改变常常对应着大的语义差异。 


11.4 隶属函数和量表类型 

假定读者在方法论课程上学 > J 过典型的尺度类型分层。它们按顺 
序是 :定类 、定序、定距及定比的尺度。要想描述这些尺度之间的差异. 
通常要部分基于它们在比较个案时所包含的信息量。例如，定类尺度 
包含的信息较少 • W 为它们只可用于类別比较,定距和定比尺度包含的 
信息量最多•因为它们可用于进行规模测量。 fl 史蒂文斯发表经典文 
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章 （ Stevens ， 1946, 1968) 以来，这些尺度类型已成为任何基础统汁学 
训练的一部分。 

那么，这些尺度类型是如何与模糊集分析中的隶属函数相匹配或 
不匹配的呢？ 一个好的起点是零点。定距尺度之所以不同于定比尺 
度，是因为后者有一个真实的零点，而前者没有。例如，你的银行账户 
中的钱是一个定比尺度，因为达到零点就会使账户清零•欠债与余额为 
正的差异巨大。 

在模糊集分析中⑺隶属值却不扮演同样的角色。在模糊集分析 
中， () 值表明完全不是一个集合中的成员。例如，一个国家的非零的人 
均 GI)P 是500美元_它在“富裕国家”类别巾的隶属值无疑是0.0。从 
这个意义上看，模糊集分析中的0值接近于一个连续 M 表上的最小点 
思想，尽管二者也有差异。 

针对模糊集量表中的 1.00 隶属值也有同样的论点。 1 值表明完全 
隶属于一个集合。它扮演的角色在某种程度上类似于一个连续量表中 
的最大点。然而，在经典的量表架构中并不存在真最大值这个观念。 
例如，说一个人的富裕程度最大.这是什么意思呢？ 一个人总得有一元 
钱吧。 

经典的测量理论将两分变量看做占据着尺度层次的低端。如果有 
连续编码的数据，那么将它转换成两分数据几乎总被认为是糟糕的转 
换，因为这会丢失信息。模糊集分析提供了一个非常不同的二值化观 
点。我们可以通过考察通常用于测量民主的政体数据 （Polity data) 
(Marshall. Gurr and Jaggers, 2010) 来展示这个不同。 

图 11.3 使用了学者运用于政体数据的一个常见的二值化架构，其 
中7是一 10到 1() 的民主量表上的分界点。从统汁学立场看，对政体 
数据进行二值化会丢失大量的信息 ：我们 从一个21点的量表变成了 2 
点的量表(参见图11.3)。相比之下，从模糊集的观点看，二值化只是另 
一种语义变换函数。模糊集分析反对这类二值化，不是因为它丢失信 
息.相反，反对的是曲线的斜率，即在7这个点的垂直线太陡了（其导数 
是无穷大）。这里有一个分界点的确重要的 情况: 数据的微小改变可能 
导致语义意义的完全改变。 
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政体测试值 

图 11.3 二分变量和成员资格函数 

然时，如果调整斜率，使之不如此极端，那么对于定性学者来说.在 
评估一个国家 隶属于 民主国家集合的程度方曲，二值化步骤作力一种 
方法看起来是介现的。现在，个案的模糊 集隶厲 值会随着政体捋分 
(Polity scores ) 降到分界点7以下而从1开始逐渐下降。可以通过比 
较图 11.2 和图 1 U 中的变换（直线表示的部分）看到这一点。 M 然 [冬1 
11.3 是二值化的，但是其基本形式实际上与阁 11.2 差异不大。差异仅 
仅是连接最大（即 1.0) 和最小(即 0.0) 隶属值的直线的倾斜程度不同$ 
r 。 对于模糊集分析者来说 ，二 值化的隶属函数虽然有问题•却 nj ■能比 
隐含在21点政体得分中使用的默认的线性假设更恰当。 


11.5 结论 

在本章中•我们的分析表明，模糊集方法可以很好地描述定性研究 
者通过什么方式来考1数据和概念隶属之间的关系。在这种方法中， 
一个关键的问题涉及通过恰当的语义变换将数据转换为隶属值。研究 
者关注将数据与概念的意义进行匹配•因此，要假定概念的意义支屺 r 
适当的变换。在此意义上，就模糊集分析来说•概念化的意义就统领 


KU 柷度值 
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全局。 

在定量方面，模糊集分析中使用的非线性变换的类型却不经常用 
于连接数据和变量。相反，由于数据被作为一个变量的指标来使用 • 
W 此，通常并且恰当的看法是将数据视为处在与变量的线性关系中。 
一个统汁变量的好指标一般不要求变换。相反，指标值会与变量值紧 
紧匹配。就此而言，在统计分析中，我们应该寻找那些在测量中不要求 
变换的指标。 
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1 语 义学、 统计学和数据转换 


数据转换（如幂次）可以使一个偏态分布变得比较对称。但 
是，我们为什么还要困扰呢？ 

(1) 高度偏态的分布难以考察，因为其大多数观测值都局限 
在小部分数据范围中。 

(2) 显然，当把偏态分布变成比较对称的分布时，偏态方向中 
的离群值会变得接近于数据中的大部分值。 

(3) 一些常见的统计方法用均值对分布进行汇总。然而， 
一个偏态分布的均值并不是它的中心的一个好的汇总值。 

- 约翰. 福克斯 (John Fox ) 


12.1 导言 

在统计学传承中，有关变量的转换存在着一些公认的规范，它们使 
得对数据实施沾如标准化和求对数这样的做法变得很常 见且 A : 争议。 
在已知这种传承的研究目标的情况下，这些做法在方法论 h 相当易于 
理解。然而，定性角度则强调理解个案的意义，从这个角度看，同样的 
做法就会出现问题。定量传承中的变量转换回应了统计学的律令;定 
性学者则运用一套不同的规范和价值，它们强凋语义学的重要性以及 
概念中体现的意义。例如，对人均 GDP 求对数或对民主的政体测度值 
进行标准化意味着什么，这种传承提供了备选的解释。 
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在本章中，我们介绍变量转换的基本原则 （ Fundamental Principle 
of Variable Transformation) •将它作为描述定性角度下的变墙转化的 
一种方式。该原则认为，所有的变量转换都必须使其意义得到保留或 
增加。 因此. 该原则要求，如果使用人均 GDP 的对数值 • 得到的数据应 
该比末转换的数据更好地代表学者所意指的概念，如经济发展或财富。 
在定性传承中，与这条原理不符的转化被认为是可疑的。 


12.2 标准化比对意义保留 

常见的转换是将一个变量标准化。在统汁分析中4示准化通常不 
改变结果，因为对变量执行线性变换时大多数参数估计值仍然会保 
留其特性，如无偏性。冋想一下，对变量执行标准化时用到的公式是 
(a - J )/. v ，其屮.？是均值， .V 是标准差。例如，初始的民主政 休量表 
将数据编码为从 一 10 到 10( Marshall , Gurr and Jaggers, 2010)。 标准 
化的过程就是将这些数字转变为一个新的量表，其值表示远离均值多 
少个标准差。 

标准化的结果显然依赖于基础数据，而不依赖于与所测量的概念 
定义有关的数据。统计均值和标准差会随着基础数据的改变而变化。 
事实上.就标准化来说，如果其他个案的得分改变•那么任何一个个案 
的得分都会轻易地改变。一个个案可能没有经历任何真实世界的变 
化，但是其编码却 "1* 能改变了， W 力其他个案的编码有变。从定性视角 
来看，这看起来很舒怪 :一个 个案的得分为什么成该依赖于如何对其他 
个案编码呢？ 

为了便于具体论述,我们考察关于民主程度的政体数据集。定性研 
究#可能提出一个规则.认为“完全民主”刻画的是那些超过一定阈值的 


①然而，如架进一步转换或分析变《，情况就可能有例如•如果被转换的变最 
用 ft 交互项时即如此。 
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个案，如所有其值在7到10之间的个案。在该规则之下，任何一部分个 
案可能全是或全不是完全民主的国家，这取决于是否达到阈值。然而， 
如果数据是用标准化的值来展示的，那么人们必须使用不同的规则，例 
如，所谓完全民主描述的是那样的个案，即它们的值超出均值两个标准 
差。该规则确保仅有少部分个案被编码为完全民主。一个既定的个案可 
以移进或移岀完全民主类别•这取决于其他个案怎样被编码。从定性视角 
来看，这是有问题的。一个个案是否完全民主，这取决于该概念的定义和 
该个案的特征，不取决于作为一个整体的总体内部的民主程度分布。 

标准值的使用对于研究来说也可能有其他后果。例如，可以考虑 
这样的建议，即人们应该对变量实施标准化，以便基于其“极端”值来选 
择个案研究 (Gerring and Seawright ，2008)。 至于人们为什么要考察 

极端个案，则有一些好的理由。鉴于此，标准化的值就是一个显而易见 
的选择，因为从标准差的角度看，我们认识到极端个案意味着什 么：距 
离均值 2-3 个标准差的观测值就是极端值。因此，从统计传承内部 
看，这种思路完全可以理解。 

然而在定性传承中，运用这种思路就遇到了问题。标准化思路是依据 
取值与样本均值的关系来界定极值的，均值被看成是“中间点”。但是，对于 
定性研究者而言，样本均值可能代表或不能代表一个概念的中间点。中间 
点对应着概念的中间值。例如，政体量表的范围是从一 10到10,其概念的 
中间点可能是0。®相比之下，政体数据的样本均值大约是3。 

在政体数据中，标准化的一个后果是大多数极端个案都总是威权 
政权。由于样本均值大约为+ 3•因此 ，一 10的威权个案总是比+10的 
完全民主个案有更大的绝对标准值。在统计传承中，这一点未必有问 
题:大 多数威权个案从它们与均值的偏差角度来看都是比较极端的。 
然而，从定性的角度看4示准化会适得其反。从这一角度看，极值“明 
显”是一 10和10的个案。这些个案就与量表的概念中间点的关系方 
面，最可能存在极值。 


①政权类型的“政体测度值”等于民主减去威权，其中民主和威权的范围都是从0到 
10。在这种情况下，0在“政体”计算程序中就是概念的中间点。 
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这就引出我们在定性传承中所说的变量转換的基本 原则： 

变量转换的基本原则。所有的数据转换都应该强化数据和慨 
念的意义之间的关系。 

在前一章中，我们使用了有关“高个子”概念和高度数据的例子。 
定性研究者可以转换高度数据，但是其动机是要实现与所关注的概念 
更匹配。相比之下，标准化（如对高度数据标准化）的动机通常不是与 
任一概念相匹配，因此，它就违反了变量转换的基本原则。 

简而言之•定性的、语义学探究通常将标准化视为一步倒退。它将 
一些无关的考量(即潜在地变动着的数据分布)引入到一种语义关系之 
中。数据的标准化通常违反了变量转换的基本原则。它加入了现实世 
界的数据分布的某些方面，这些方面没有益处且有潜在的误导性。① 


12.3 对数转换一模糊集转换 

取一个变量的对数（即用其自然对数)非常常见，并且在统计研究 
中经常被推荐使用。举一个经典的例子，对人均 GDP 取对数很少有争 
议。虽然并不是所有的学者都运用这一转换，但我们仍然可以看到，在 
各类研究中有无数例子都使用了这种转换。 

在定性方面，模糊集分析提供了一套工具，用它来设定人均 GDP 
和财富或经济发达国家概念之间的关系。模糊逻辑关注的是，数据在 
多大程度上表明个案隶属于财富集合或经济发达国家集合。根据标准 
的惯例(参见第11章），得分为0意味着一个国家不属于财富集合或经 
济发达国家集合，得分为1意味着完全隶属.即个案是富裕的或经济发 


①至于为什么标准化经常不是一个好做法•弗里德曼 （ Freedman , 2009：87 -88) 利 
用胡克定律 （ Hooke’s law) (参见第】6章.该章将胡克定律作为一个例广宋考域）给出了梢 
彩的展示。 
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达的国家。个案的隶属得分也可以在0和1之间。 

在使用人均 GDP 去评估各个国家在多大程度上是富裕或经济发 
达的国家时•两种传承采取不同的方式，考察一下两种方式的差异是冇 
益的。通常情况下•定量传承假定人均 （;[) P 水平和国家发达程 度之问 
存在着线性关系•如图 12.1 中的虚线所示。这里通常有一个隐含的假 
定，即经济发展随着人均 （;1) P 线性增长。然而，如果使用对数值肩们 
就得到图 12.1 中的实线。对这条线有一个潜在的解释是（另一种解释 
阽下文），在人均 GI ) P 和经济发展之间存在着收益递减的关系。换言 
之，图】 2.1 中对数曲线的斜率随着人均 GDP 的增加而降低。 


0 5 10 15 20 25 30 35 40 

人均 GDP (单 位： f - 元） 

资料 来源： Ragin , 20 ()8 : 9 2—汨。 

图〗 2.1 线性、对数和模糊逻辑的数据转换 

在模糊集分析中，通常假设连续的定量数据和隶属得分之间的关 
系呈 S 形曲线。在图 12.1 中，人均 G[)P 和经济发达国家之间即遵循 
这种模式•如图中的星线所示（见 Ragin ， 2008:第5章）。在这种模糊 
集的转 换中. 人均 (;[) P 低的个案都得到同样的0编 码值; 从语义学观 
点看，这些个案在所关注的概念（经济发达国家）中都没有隶厲关系。 
这就是在第11章中所讨论的次要变异原理。这些个案处在人均 GDP 
非常低的水平，接近图 12.1 的原点。 

一旦个案幵始隶属于一个概念，小的差异就会大大地影响它们在 



经济发达 W 家 
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多大程度上成为经济发达国家集合的成员。因此.尽管当人均 GI ) P 处 
在 2 500-5 000 美元时，模糊集曲线的斜率变得更陡，但是模糊集曲线 
总体来讲类似于对数曲线。从模糊集曲线的另一面来看，拥有高水平 
的一系列个案全被编码为 1. W 为它们都是概念的完令成员。其结果 
是，模糊集曲线的右侧变得显著平缓下来。 

就对数值来说，在人均 （; I ) P 顶端的变动也变得相对不重要了（尽 
管斜率没打变成完全平缓）。低端的变动（例如在人均 （; I ) P 低于 2 500 
美元的个案之间的变动）却非常重要。这是与语义的、定性方法的根本 
差异。从语义学的角度来看隶属于“经济发达 W 家”的程度，可以认为 
低端个案之间的差异并不十分重要， W 为这些 W 家显然不是经济发达 
国家。例如•乍得 ( Chad ) 和马里 （ Mali ) 的人均 （; I ) P 之差不 重要; 它们 
隶属于经济发达国家类型的程度都是 0 。 但是 >(•] •于使用人均 GDP 对 
数的学者来说，低端之叫同样的这々小差异就会 W 对数转换而放大（如 
图 12.1 所示.对数线从原点汗始就逐渐变陡）。从这个角度看•乍得和 
马甩之间的人均 GDP 之差对于它们的经济发展水平来说就相当重要 
了。对于贫困的国家来说，人均 GDP 的小幅度增长意味着其经济发展 
的大幅度进步；时对于富裕国家来说•小变动的后果不大。 

这一差异与两种传承的不同规范有关。 fr : 定性传承中•人们必须 
总是追问正在测量的特定概念的意义是仆么，将它理解为各个个案所 
隶厲的集合。研究者的责任是，将数据进行转化•使份人均 GDP 与研 
究者所意味的富裕或发达国家更好地匹配。相比之下 •在 定量传承中， 
研究者是因为数据偏态或要增加统计模型的拟合度才对数据求对数 
的。从定 性视角 来看，这些类型的考虑似乎并不 恰当； 而从统汁学的立 
场出发，正如本章导语所表明，这些考虑很容易理解。 


12.4 数据转换的基本原理 

为了解这些可替代的数据转换的基本原理 （ rationale ) • 考察一 
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图 12.2 直方图也清楚地表明，有相当多的国家是非常富裕的（即 
人均 GDP 高于2万美元的个案）。这些个案是被编码为完全隶属于经 
济发达国家集合的国家。位于中间的个 案数量 (模糊集合中隶属值介 
于0和1之间）相对较少。多数个案要么完全属于.要么完全不属于经 
济发达国家。 

在模糊集转换中，原始数据和切割点之问是什么关系？尤其是，针 
对完全属于、不属于、一定程度的部分隶属的个案•研究者如何决定在 


10 


0 




4 


10 


11 


5 6 7 8 9 

人均 GDP (千元）的对数 

图 12.2 依据初始和对数化的人均 CI ) P 给出的国家分布 


0.5 2.5 4.5 6.5 8.5 10.5 12.5 14. 5 16.5 18. 5 > 20. 5 

初始人均 GDP (千允） 


下不同水平的人均 （; I ) P 个案的分布是有益的。如图 12.2 所示，大多 
数个案的人均都很低。从模糊集的视角看，人们的结论是•大多 
数国家都不隶属于经济发达国家的范畴中。 


5 0 5 0 5 0 5 
4 4 3 3 2 2 1 

IHI 家的数= 
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哪里绘制截止点？在图]2.1中.数据和编码决策源自拉金 （ Ragin ， 
2008)。如何运用专业知识来绘制截止点，他的讨论为我们提供了一个 
好例子。在他的编码决策中，关键因素是确定完令隶属（人均 GDP 为 
2万美元）、无隶属（人均 GDP % 2 500美元）的阈值，以及类别成员和 
非类别成员（人均 GDP 为5 000美元）的个案数相等的交叉点，并在模 
糊集合中被编码为0.5。他研究了一些学者和如 [ U : 界银行这样的重要 
机构是如何确定一些国家是富有还是贫穷的，从而部分地获得了切割 
点。他在设汁图 12.1 中 S 曲线的形状时使用了它们的语义学实践。 
因为学者和大多数机构的现实世界语言都支持转换，最终的个案隶属 
于集合的分值对于该共同体来说是有意义的。也就是说•国家的隶属 
值应该符合专家对财富和经济发展的概念定义和探讨。 

因此•在定性方法上•人们在实施数据变换时.采取的方式应该旨 
在满足变量转换的基本原则。人们对原始数据进行转换，以便它们更 
好地匹配分析者或相关的共同体所意指的概念。由于它在一定程度上 
是一个解释的过程•分析者在进行数据转 换时. 观想的情况是清晰地阐 
述所使用的标准。这些标准可能反映着大众语言和普遍的文化习俗、 
专业知识及用法.和/或研究者关于所研究的现象的实质知识。用线 
性、取对数或标准化的转化，可能保留或提升一个既定概念的意义。但 
是这一点不能被宄验地假定 成立; 它需要通过明确地评价个案的编码 
和概念的意义之间的匹配程度来展示。 

现在转向统计传承中的对数转换，图 12.2 下方的图清晰地表明， 
当使用对数值时个案的分布产生 f 巨大变化。现在•数据接近于正态 
分布。通过使初始人均 GI ) P 很低的许多国家之 M 的差异变得明显，即 
可产生这种分布。因此•人均 GDP 少于2 50 U 美元的国家构成了图 
12.1 下面直方图左方的大多数变异。人均 GDP 低端的变异与语义学 
的、模糊集合分析不相关，这在对数化的数据集合中至关重要。 

在如图 12.2 这样的例子中，当定性研究者看到取对数后的个案分 
布有变化时•他们可能怀疑这一方法。在此例子中，新数据意味着大多 
数国家处于中等的经济发展水平，定性研究者或许感到这不可信。他 
或她可能关心的是，变换歪曲了潜在的经验真实。 
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然而，从定 M 传承内部角度看，针对对数值的使用有相当多介道理 
的辩护。有时候，出于理论原因而使用对数值。例如，琼等 （Jone et 
aU 2009 ) 论证并从经验上指岀•几乎所有的政府预算都遵循幂律分 
布。这种分布是 y 〜 a ? •它意味着明显的经验检验就是对等式的两边 
取对数。这种转换是合理的。 

取对数的另一个常见的理由在于数据是偏态的。取对数在消除偏 
态上是有效的.如图 12.2 所示。这种转换背后的基本原理要求关注数 
据的真实世界分布问题。如果你的研究目标是用统计方法进行有效的 
推断，那么数据的偏态就是一个严重的问题，需要纠正。 

最后，取对数的另一个道理是结果数据能够更好地拟合统 il •分析， 
所谓“更好地”意味着有更强的实质性影响或更卨的 M 著性水平。这类 
道理可归人设定搜索 （specification searches ) 这个标题之下（例如 
Learner , 1978) ,该标题在过去儿十年里引起丫统计学家的广泛讨论。 
人们可以想象进行各类变量转换，然后选出一类能给出最强结果的变 
M 转换。人们偶尔会发现，提升的拟合度是否辩护了一种特定类型的 
变量变换，定量学者是有争议的， 1 然而 • 从定性的、语义学观点看，模 
型拟合问题 l 、 V : 该 1 j 如何最好地转换原始数倨这个问题完全分汗。仅仅 
为广提高统计拟 合度而 转换变 M 是冒风险的•即它吋能违背变 M 转换 
的基本原则。 


12.5 结论 


定 M 和定性研究都对原始数据进行转换。然 ㈣ ，它们/ I •:实施这些 


①例如，库尔茨和施兰克 Wunz mui Schrank , 2007) 认为•治理与经济发展无关。 
lit 界银行经济学家问应说 :“在 下一组凋卉中.我们将展示与炸尔茨和施兰克的初始设定 
有两项微小变化的后果。与他们不同，我们不加人人均 C ； DP 水平•而加入其对数水平值。 
这种做法在跨国的经验研究中是非常标准的做法.并且在统汁 I :也比较恰当，因为 W 变量 
和对数的人均 （; I ) P 之间的关系更接近 于是线 性关系，并目.我们使用的是线性回1模型。” 
(Kaufman et ; il .. 2( K )7 :「)9 ) 。 
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转换时所遵守的规则大不相同。定量研究者采用诸如标准化和取对数 
值等做法帮助他们努力执行良好的统计检验。定性研究者几乎不对原 
始数据进行标准化和取对数。相反，他们“校准” （Ragim 2⑻ 8) 数据， 
使之符合分析者和(或)相关的专家共同体所界定的概念的意义。 

需要再次指出的是，我们并不认为一种方法一定优于另一种。实 
际上，我们认为，两种方法在各自的总体传承的情景下都是可以理解 
的。因此，我们已经表明，在统计传承中，对原始数据进行标准化或执 
行对数转换都很有道理。同样，在定性传承中，在针对一个概念将隶属 
值指派给个案的时候，忽略一些变异也可以理解。在一种传承中可能 
是不合适的做法也许在另一种传承中相当合适。 

参考文献与推荐读物 

一些导读性的统计学教材讨论了如何计算标准值，如何进行对数 
转换以便消除偏态性。关于如何利用模糊集分析对初始的定量数据进 
行转换，尤其可以参见拉金 （ Ragin ， 2008)。有关定量和定性的转换方 

面的例子，参见下面有注释的文献。 

Brown ， J .， J . Earle , and S . Gehlbach . 2009. “Helping Hand or 

> 

Grabbing Hand ? State Bureaucracy and Privatization Effectiveness .” 
American Political Science Review 103:264 — 283. 在该例子中，大多 
数变量都取了对数。 

Busse , M. ， and C . Hefeker . 2007. “Political Risk , Institutions 
and Foreign Direct Investment .” European Journal of Political 
Econony 23 : 397 — 415 .他们想将“对外直接投资”变量取对数，但是那 
将导致负数，因此，他们利用 y = log(x + ( x 2 + 1产 5 ) 对数据进行了 
转换。 

Garment , D . ， S . Yiagadeescn , and S . Prest . 2009. “State 
Fragility and Implications for Aid Allocation : an Empirical Analysis .” 
Conflict Management and Peace Science 25:349 — 373 .注意他们如何 
用婴儿死亡率 （ infant mortality ) 的对数值和标准化值来表示生活标准 
的指标。 
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Fearon , J . 2003. “Ethnic and Cultural Diversity by Country .” 
Journal of Economic Growth 8： 195 一 222. 他认为，族群多样性的一个 

测度要好于另一个，因为个案的分布不是偏态的。 

P ’ ischer ， C . , M . Hout ， M . Jankowski ， S . Lucas , A . Swindler , 

and K . Voss . 1996. Inequality by Design : Cracking the Bell Curve 
Myth . Princeton ： Princeton University Press . 作者们批判了对钟形曲 
线 （Bell Curve ) 数据实施正态化处理。 

Freedman ， D . 2009. Statistical Models : Theory and Practice , 
revised edition . Cambridge ： Cambridge University Press . 

Gerring ， J ., and J . Seawright . 2008. “ Case-selection Techniques 
in Case Study Research : a Menu of Qualitative and Quantitative () p - 
tions .” Political Research Quarterly 61 : 294 — 308. 

Goertz , G ., and J . Mahoney . 2005. “ Two-level Theories and 
Fuzzy-set Analysis .” Sociological Methods and Research 33: 497 
538. 作者们将来自斯考切波 （ Skocpol ) 的《国家和社会革命》 （ States 
and Social Revolutions ) 的定性数据重构为模糊集合。 

Herrnstein , R . , and C . Murray . 1994. Bell Curve. New York ： 

Free Press . 他们使用的智商检测值不是正态分布的，因此，他们将这些 
值转换成正态分布；批评意见，参见 Fischer et al . ，1996。 

J aggers , K ., and T . Gurr . 1995. “Tracking Democracy's Third 
Wave with the Polity III Data .” Journal of Peace Research 32: 
469—482. 

Jones , B . ， F . Baumgartner , C . Breunig , et al . 2009. “A General 
Empirical Law of Public Budgets ： a Comparative Analysis •” 
American J our rial of Political Science 53：855 — 873. 

Kaufmann ， D . ， A . Kraay , and M . Mastruzzi . 2007. “Growth and 
Governance ： a Reply .” Journal of Politics 69:555 — 562. 

Kurtz , M. ， and A . Schrank . 2007. “Growth and Governance : 
Models , Measures , and Mechanisms .” Journal of Politics 69： 
538—554. 
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Learner , L . 1978. Specification Searches : Ad Hoc Inferences 
With Nonexperimental Data. New York ： John Wiley Sons . 

Londregan , J ., and K . Poole . 1996. “Does High Income Promote 
Democracy ?” World Politics 49:1 — 31 .为了能够利用他们偏爱的统计 
方法，作者们利用下面的公式对“政体量表 ” （Polity scale ) 实施 转换： 
T ( S ) = log(S + 10.5) - log (10.5 - S ) ,其中 S 是政体民主得分。 

Mahoney ， J . 2010. Colonialism and Post colonial Development : 
Spanish America in Comparative Perspective. New York ： 

Cambridge . 作者利用定性历史数据来建构个案的模糊集成员值 （ fuzzy - 
set membership values ) 0 

Marshall , M . G ., T . R . Gurr , and K . J aggers . 2010. Polity IV 
Project : Political Regime Characteristics and Transitions , 1800 — 
2009 . Center for Systemic Peace ， www . systemicpeace . org / polity / pol - 
ity 4. htm . 

Ragin , C . 200(). Fuzzy-set Social Science , Chicago ： University of 
Chicago Press . 

Ragin , C . 2008. Redesigning Social Inquiry : Fuzzy Sets and 
Beyond • Chicago ： University of Chicago Press •参见第 5 章对模糊逻辑 
变量转换和校准的详尽讨论。 

Zadeh , L . 1965. “Fuzzy Sets •，’ In formation and Control 8 : 
338—353. 
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1 概念的对立面与类型学 


二值逻辑并不是充当人文科学基础的正确逻辑。为此目的. 
我们需要的是模糊逻辑。本质上讲，模糊逻辑就是拥有不明显边 
界的分类逻辑。 

-洛蒂 • A . 扎德 （Loti A . Zadeh ) 


13.1 导言 

概念的一个奇特之处是可以用专业术语指明一个既定概念的对立 
面。概念常常以反义词对 (opposing pairs ) 的方式岀现，如民主-威权、 
战争-和平和富裕-贫穷。以一对形式出现的一个概念是否等价于另一 
个概念的反面，这是一个具有重要理论和方法论含义的核心问题。例 
如，是否富有=不贫穷，战争=不和平？我们可以更一般地提出如下 
问题： 


概念的否等于其对立面吗？ 

用我们通篇使用的民主例子来说，不民主等于威权吗？ 

我们认为，在回答这个问题时，定性传统中的学者通常会说•“不”。 
定性学者采用一种非对称的方法，认为不民主是一个不同于威权的概 
念。相比之下，定量传统中的研究者对该问题的回答通常为“是”(至少 
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在方法论实践中）。当在统计模型中测量和使用概念时，定量传统接受 
一种对称的概念观及其反面。例如，可以将一个政体的民主程度理解 
为恰恰是其威权程度的否。 

一个相关的问题涉及类型学中概念之间的边界。传统观点认为， 
类型学应该建立在互斥范畴的基础之上。每一个观测只能属于一个范 
畴。 ©一 个国家不能同时被编码为“民主”与“威权”。然而在实践中，这 
种类型学分析通常与我们在世界中看到的不同。在政府的人口普查 
中，族群范畴就是一个明显的例子。我们也许会说，奥巴马在如下三个 
族群中拥有非零的成员资格：（1)非洲裔美国人； （2) 白人； （3) 非洲人。 
然而，我们如果允许奥巴马总统在这三个族群中都有一定的成员资格, 
就违反了互斥类型学规则。② 

在定性研究中，学者(在实际的研究实践中）总是反对互斥的类型 
学假定。在这种语义导向的传统中，说奥巴马总统至少在两三个不同 
的族群类型中享有部分成员资格，这是合乎情理的。在这个主题上，我 
们表明，有了这种非互斥的假定，模糊集分析自然是分析类型学的数学 
方法。 


13.2 针对概念对立面的对称及非对称的研究 

为了阐明针对概念对立面的不同研究路径，让我们考察民主和威 
权的概念。现在，为简便起见，想象用政体数据二分地测量民主概念 
( Marshall , Jaggers and Gurr , 2010)。 政体量表的范围是一 10 到 10, 

一个可能的二分动作是将得分在 7-10 之间的个案看成是民主的个 
案。那么，关键问题是怎么界定得分在一 10到6之间的那些个案？应 
该称这些个案为“威权”，还是“非民主”的例子呢？ 


① 除此之外，一个类型通常应该在总体上是穷尽的，即全部观测值都应该被归炎:。 

② 2010年8月•格尔茨收到一封来 ft 大学的电子邮件，信中说新的联邦条例允 i 午个 
沐 / K 联栉表中选杼超过-个族群。 
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在定量传承中，如果采用二分范畴(它通常不是首选），非民主和威 
权就是相同的。所有得分在一 10到6的例子都既是非民主又是威权 
的。这些个案完全有别于得分为7或更高的民主例子。为了阐明这种 
方式下二分范畴的排他性，图 13.1 展示了政体得分和一个个案隶属于 
民主集合的程度之间的关系。X轴是民主程度测度， Y 轴是民主集合 
中的成员资格测度。正如该表所示，7这个切割点可以用全有或全无 
式 (all or nothing terms) 来理 解:在 该点及以上，一个个案完全在民主 
集合中，在该点以下，个案完全在民主集合之外。 


-10 -8 -6 -4 -2 0 2 4 6 8 1() 

政体量表 

图 13.1 定量传承中对称的成员资格函数图式 

当在定量传统中应用连续变量时.概念对立面的对称假定也适用 
(总体上讲，在定量传统屮首选连续变量）。对于有关威权和民主的假 
设来说，通常选用同样的连续变量，这也是恰当的。一个个案在多大程 
度上是民主的.这不过是它在多大程度 t 为威权的否。在图 13.1 中. 
虚线展示了连续测量的政体得分和连续测量的民主集合的成员资格值 
之间的标准的线性理解的关系(参照第11章）。在定量传统中，同样的 
线性关系也适用于威权主义，除了它现在是逆向关系之外（即在威权主 
义中，政体得分与成员资格呈负向线性关系）。这种对称模式适用于很 
多概念。例如，经济发达与不发达都可以用同样的人均 GDP 指标来测 
量。如果有一个好的经济发展水平的测度，就有一个好的经济不发达 
水平的测度。 



隶属度 
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相比之下，这种对称性在定性传统中通常不适用。实际上，图 
13.1 给岀的政体测度和民主集合成员值之间的任何一种关系都不是 
定性传统中的一项好的选择。相反，当人们主要关注语义学和意义 
时，图 13.2 阐明了一种更典型的方法。有人也许论证到，只有当一 
个个案的政体得分为10的时候，它才在民主集合中拥有百分之百的 
成员资格 ( Goertz ， 2008)。在文献中，二分标准将得分低于7的个案 
标记为完全不民主。然而，一旦有人从模糊集的角度来看民主，那么 
从较低水平——如图 13.2 中的4——开始看就是合理的。因此，得 
分在4和10之间的个案就部分是民主集合的成员，部分是非民主集 
合的成员。① 

在模糊集分析中， X 的编码是从1到0, X 的否是1减去 X 的成 
员资格得分。因此，在图 13.2 中，虚线代表的非民主值等于1减去民 
主值(即一— X )。模糊集分析的否就是其字面意义 :初始 成员资 
格值的否。 

然而，非民主和威权不是相同的概念。具体来说，它们不具有相同 
的成员资格函数。例如，人们采取一定方式将政体数据和威权联系起 
来，这种方式可能非常不同于将政体数据和民主联系的方式。例如，政 
治得分为一 10到一4的个案或许被认为完全是威权类别中的 成员； 得 
分大于一4小于2的例子可能被视为在该类别中有部分成员 资格； 得 
分为2或更高的个案则在该类型中不具备成员资格。 

关键在于，在这个传统中，民主和威权的概念并不对称。它们是不 
同的概念，因此有不同的成员资格函数。当然，非民主和威权有关，它 
应该如此。然而，它们不是相同的事物。从语义学的观点看，这一点对 
于很多对立的概念来说都成立。例如，大多数人都同意“不战争”与“和 
平”是不同的概念。以色列和埃及处在不战 状态; 但是并不清楚它们是 
否和平共处。 


①政休概念针对民主和威权有独 立的爆 :表。所以，尽管大部分学者通过从民主变 
量中减去威权变量来汁算政体量表人们也可以把民主和威权分开•并给予不同的编码。 
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简而言之，由于一个概念的否在意义上不同于此概念的对立面， 
因此，语义学的路数会假定对一个概念及其反面的测量也不对称。 
每一个概念都要求从自身出发，依据它们自己的界定和意义来测量。 
我们称之为定性研究中的概念对立面原则 （the Principle of Conceptual 
Opposites ) 0 

概念对立面 原则： 一个概念及其对立面的意义和测量是不对 
称的。 


13.3 重叠对比排他的类型学 

定性研究者常常反对这样的观点，即类型学中的范畴必须互斥。 
例如，在图 13.2 中，对民主和不民主的模糊集编码明显违反了排他类 
别原则。 一 些个案（即政治得分大于4但小于10的个案）同时是民主 
和非民主类別的成员。同样的不排他性也适用于有三个及多个类别的 
类型学，如民主-半民主-威权，或者下层阶级-中产阶级-上层阶级。 
一些个案会同时属于多个类别。 


成员资格值 
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图 13.2 定性传统中民主及其否的概念化 
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继续用民主例子，很多学者最关注介于民主和威权中间的类 M ， 有 
时候被定义为半民主 （anocracy ) 。①当对这些个案实施编码的时候，在 
统计文献中使用的一种程序是将政体量表的中间领域（例如一5到 5) 
当做半民主状态，将两端当做非半民主（即威权和民主）。这种办法已 
经应用于费伦和莱廷 （Fearon and Laitin , 2003) 关于内战的有影响力 

的研究中，现在这种方法已经普及。运用这种三分法的学者们通常将 
二分变量分成三类。图 13.3 展示了针对虚拟变量的标准三分编码。 
每个国家-年 ( countr y - y ear ) 都落入三类中的一类，且只落入一类。 


— 10 —8 —6 一4 —2 0 2 4 6 8 10 

政体量表 

图 13.3 民主-无政府- 威权: 互斥类 

利用政体数据对这些概念进行模糊集编码会与图 13.3 中的编码 
有很大差异。模糊集分析通常不使用明显的 拐点； 模糊集方法也不遵 
循互斥分类规则。类别之间的过渡是逐渐的和部分的，而非突然中断。 
如图 13.4 所示，威权、半民主和民主之间可以有或多或少的重叠。某 
些国家可以同时处在威权和半民主状态，某些国家 M 吋处在半民主和 
民主状态。 


①关于混合政体的大量文献(如 Schedler ， 2002； Lecitsky and Way . 2010〉主要考 
察这种中间类型。中间类 M 对于关于内战（如 Vreeland , 2008) 和国际战争 （ Goemaas ， 
200())//| fii 的研究来说也很取要。 



成； ： w 资格俏 
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0.01 - - - L -^- L -^-- 

~ * 10 一8 —6 —4 _ 2 0 2 4 6 8 10 

政体量表 

图 13.4 重叠类 ：民主 、半民主、威权 

为什么在统计分析中不使用这些模糊集编码呢？这里没有内在的 
原因。在统计学架构内，它们只是三个变量，其范围是从0到]。然 
而，更常见的方法是图 13.3 中的互斥设置，这也是很多定性研究者所 
使用的方法。这本身没有什么不对，倒是反映岀一种不同的决策，它决 
定如何划定类别之间的边界线。模糊集分析优先选择渐变过渡，互斥 
架构则暗含着突变。 

总之，尽管定量研究中的类型学通常被理解为是由互斥的类别组 
成的，但语义学的概念研究则诉诸一个与之对立的观点。我们将这种 
定性的替代选择称为概念重叠原则 (Principle of Conceptual Overlap ) 0 

概念重叠 原则： 类型学中相邻的范畴可以重叠而非互斥。 

无论在社会科学中使用模糊集合分析，还是在现实世界中用它来 
设计常用的器械时，概念重叠原则都居于核心。 


13.4 语义学和名义类型学 
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考察在刻画政治制度中使用的概念的历史是很有趣的。表 13.1 
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重新展示了格尔 ( Gmr ，1974) 最先提出的政治体制三分法，给出了三 
种名义类别。这些初始的类型是独裁政体、民主政治和无政府状态，它 
们各自都有由界定性特质构成的组合。可以推测，格尔认为这些范畴 
是互斥的。然而，他使用了至少五个定义维度（即表 KU 中的威权变 
量），每个又至少有两个可能取值，即便如此，这三类显然仍然无法穷尽 
政治体制的全部可能领域。某些政治体可能拥有格尔的类型中的至少 
两个特性。 


表 13.1 民主-半民主-威权 :格尔 （1974) 的初始构想 


权威变量 

独裁政体 

民主政治 

无政府状态 


归属=1 



行政部门聘用 

指派=1 
双 重=1 

竞争性选举= 2 

恺撒式=1 

决策限制 

无限权威=2 
轻微限制=1 

立法平等= 2 
实质限制=1 

无 

参 与 

压制= 2 
约束= 2 

制度化的= 2 

非制度化的=2 
派系/约朿的=1 

指 导 

威权主义= 2 
部分附加=】 

无 

最小化= 2 

集中化 

无 

去中心化=1 

去中心化= 2 

最大分数 

7 

7 

7 


资料 来源: Gurr , 1974 


如果目标是掌握有用的名义范畴，那么应该怎样处理不适用于已 
有范畴的那些个案呢？ 一种可能性就是简单地把它们当做“缺失数 
据”，或者把它们排除在经验分析之外。然而这种办法看起来是有问题 
的，除非有明确的和可辩护的理由去放弃这些个案。一个替代的、语义 
学的解决办法是，询问这些个案是否可以被容纳到现存的类型学范畴 
内•或者它们是否要求有一个新的类别。这种语义学方法允许分析者 
在分析时将所有相关的 个案费 括其中，要么将其放置在已有的范畴内, 
要么建立新的范畴。 

为了进一步说明，我们再一次回到政体数据。这个数据因其对某 
些特殊个案的编码方式而声名远扬(或声名狼藉)。这鸣个案后来得到 
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了广泛的关注(如 Vrceland . 2008)，因为在分析与内战和人权亵渎有 
关的结果时，它们影响了相关发现。下面有政体数据中三种特殊个案 
编码的官方声明（某些细节略） •_ 

中断阶段（一66):成分变量值“一66”代表着“中断阶段”。从 
操作角度讲，如果一个国家在战争期间被外部力量侵占，进而终结 
了旧的政治体制.那么政体数据库都将该个案编码为中断，直到一 
个独立政府得到重建。 

空白阶段（一 77): 政体成分变量的一个“一77”编码值表征着 
“空白期”，在此期间，中央政权完全倒塌。这最有可能发生在内战 
时期（例如，1978年到1986年间的黎巴嫩）。 

过渡阶段（一 88): 分值 为“一 88”表示过渡期。某些新政体之 
前有一个“过渡期”，在此期间，新的制度正在筹划，合法地组建并 
付诸实施。在包含立宪会议和公民投票的程序中，民主的和准民 

主的政体尤其可能产生。在这个过渡期间，所有的指标都被记为 
“一88”。 (Marshall and Jaggers , 2002： 16) 

在定量传承中，这些编码经常被看做一个缺失数据问题。一个标 
准的做法是将带有这些编码的个案排除在统计分析之外。在这种做法 
中，一些学者自然会试图估计“缺失值”。现在，政体数据库本身也有一 
个程序赋予“一 77”和“一 88”的个案以一定的政体得分。① 

相比之下，对该问题的一个定性的、语义学研究始于考察在一 66、 
— 77 和 一88 等编码中体现的概念。一66的个案涉及“外国侵占”， 
一77的个案与“无政府状态”有关 ，一 88的个案则是那些“过渡期”类 
型。有人也许会问，这些类型个案的特点是怎样与民主、半民主和威权 
等概念匹配(或不匹配）的呢？ 一种可能性在于•它们仅仅是不同的概 
念，因而可能不适用于民主、半民主和威权清单。 


①普拉姆拍和 Iff 1 M ■迈; j ; (IMiimper and Ncumaycr ， 2010 ) 批评 这种政体数据做法. 
但足他们也假定该问题只是一种缺失值问题，这些个案应该被编码为 一10 到的政体 
得分。 
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无政府状 态的一 77个案是一个很好的开端。在初始的格尔编码 
中，无政府状态是一类常规类型。随着时间的推移，格尔的无政府状态 
对于某些个案来说变成了半民主•对于其他个案来说变成 了“一 77”。 
问题是•政体量表是政权类型的一种测度，而在根本没有正常运转的政 
府的情况下（例如，失灵的国家或者大规模内战的情形）•我们应该如何 
探究个案.这是不清楚的。现在•政体数据在其量表中将这样的个案编 
码为0,但这似乎与中央政府缺失或垮台的半民主状态混淆了。由于 
“政府类型”不同于“政府存在”，从概念的角度来看，自然要考虑有一个 
新的变量，即“无政府状态”。无政府状态不是缺失数据的问题，它从概 
念匕讲是单独一个问题。①对于很多经验研究项目来说,也许可以将相 
关的观测总体界定为所有拥有政府的国家。在这种总体的定义下，无 
政府状态的个案会被排除•但不是因为它们是缺失数据，而是因为它们 
不符合定义相关个案空间的标准。 

-66 是外强侵占的个案，它们也值得从概念的角度来思考。与无 
政府状态不同，在外强侵占下的国家是有政府的。大多数外国侵占者 
都是“军政权”。在第二次世界大战期间，德国侵占法国并没有造成无 
政府状态，而是产生了由德国人执掌的军事政府。因此，就概念角度而 
言，一种选择是把这些个案编码成像其他军事政权一样，即威权政体。 
它们中的有些个案也许是部分军事侵占的个案•就像美国在伊拉克和 
阿富汗一样。另一种选择或许会争论说，所有的国内政权都要求有一 
个自治和完全独立自主的国家。因此，军事入侵的个案就会落入一个 
独立的范畴，诸如“非主权政体” （ non-sovereign polity ) ，它可以包含所 
有的殖民个案。不管怎么样，这些外国入侵的个案都起源于概念问题， 
与缺失数据关系不大。 

最后，相似的观点也适合于“一88”，即过渡期个案。这些个案的问 
题实际上并不在于缺失数据；人们关于缺失数据常常有丰富的信息。 


①很多人把内战1成是无政府状态的一种情境来分析（如 Maher ， 1997)。问样类 
咽的问题也出现在国际冲突文献之中。例如•克莱因等 （Klein t、i al .，2006) 将两个11家之 
间的 关系的实质概念化力 ：从友 好到敌对。问题在于•当两个 W 家（如玻利维亚和缅衂 ） 之 
间没有关系时•该怎么做？ 
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问题在于，它们的政治制度仍然在规划进程之中，至于初期的机构应该 
如何与像民主这样的要求有清晰、明确和稳定的政治规则的类别匹配 
起来，这一点仍然不清楚。一个可能的途径是，考虑到这些过渡个案 
缺乏一个运转的政府结构，因而主张它们也属于“无政府状态”一类。 
一些人或许不同意，但这种不同意的本质涉及的是概念问题，而不是关 
于这些个案的经验特征的争论。 


13.5 结论 

定性研究者经常利用类别的反义对（如民主对威权）和类型学 
(如民主的、半民主的和威权的政权）。然而，他们的语义学方法却引 
导他们使用一些类别性的工具，使用的方式相当背离了定量研究的 
规范。他们未必将一个正概念及其反面看成是对称互逆的。一种关 
于发达的测度未必是不发达测度的否。因此，当定性研究者分析发 
达国家和不发达国家的时候，他们并不把它们看做互为映像的。对 
于定量研究者而言，这一点可能看起来奇怪，因为定量学者自然的默 
认选择是假定一个概念及其反面是完全对称的。在定量传承中，一个 
个案提高了发达水平，即可以理解为同时并且等量地降低了其不发达 
水平。 * 

在实际的研究实践中，定性研究者有时也会拒绝一种相关的论点， 
即类型学分类必须是互斥的。他们经常允许邻近的类别之间可部分地 
相互重叠，因为这就是我们在日常语言中使用概念的方式。再次重申， 
从定量的观点看这也许相当奇怪，因为在这种传承中，类型学被看做由 
那些天然就互斥的名义范畴组成的。然而，从语义学的观点看，世界并 
不是恰好被分成完全分离的类别。在现实世界的许多个案所展示的类 
型学中往往有多个类别，很多个案同时隶属于多个类别，如果假定在名 
义量表中有明确的边界，就不足以捕捉到这种情况。 
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第 四部只 钿究设计与罾腥祀 




14 

个案选择与假设检验 


当基于因变量的一个特殊值来选择观测值时，如果不考虑到 
因变量取其他值的事例，我们无论如何也不会把握因变量的原因。 

- 加里 • 金 (Gary King) 

罗伯特 • 基欧汉 （Robert • (X Keohane) 

悉尼 • 维巴 （Sidney Verba) 


14.1 导言 

有各种理由可以解释为什么学者会选择某些个案进行透彻的分析 
( Eckstein , 1975)。本章将探究的是，当分析的目的是评价因果假设的 
时候，在个案研究的选择方面有哪些定性和定量的实践。我们探索两 
种传承中使用的不同因果模型如何塑造了个案的类型，这些个案为假 
设检验提供了最强大的手段。对于检验关于平均处理效应的假设来说 
可能有一个好的个案，但是对于检验关于必要条件或者“充分非必要条 
件的必要非充分部分 ” （INUS conditions ) 的假设来说，它可能不是好 
个案。遗憾的是，关于个案选择的文献通常不关注所探究的因果模型 
的形式，或者仅假定调查者正在检验一个可加的线性统计模型。结果 
是，只有当我们的目标是估计平均处理效应而不是检验一个集合论假 
设时，文献中提供的大多数关于个案选择的建议才有意义。 

我们将关于个案选择和假设检验的讨论分成两部分。第一部分 
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探索的问题我们认为在文献中最令人困惑 :研究 者应该基于个案在因 
变量上的值来选择个案吗？金、基欧汉和维巴 （ King，Keohan and 
Verba , 1994) 提议，定性研究者应该避免基于因变量来选择个案，这是 
一个重大的建议。然而，定性方法论者却认为，这个建议作为一个经典 
例子，恰恰说明了诸多洞见从统计研究不恰当地延伸到了定性研究(例 
如 ， Collier and Mahoney , 1996)。我们会指出，当因果模型是（在一个 

大样本情境下)可加-线性模型而不是集合论模型时，这些建议怎样才 
有意义。在决定根据因变量来选择个案是不是一个好主意之前，研究 
者必须首先追问所研究的因果模型是什么类型的。 

第二部分关注的是哪些类型的个案为个案研究中的因果推断提供 
了最大的影响力。这个问题在多元方法研究者中间产生了一类新的文 
献（如 Lieberman ， 2005; Seawright and Gerring , 2008)。 学者曾用个 

案研究的分析来补充他们的回归结果，现在他们通常坚持这类文献中 
的观点。然而，我们相信，对于想要检验集合论模型的定性研究者来 
说，此类文献中的有些建议是有误导性的。我们用一个简单的 2 X 2 表 
来论证此观点，并追问当进行个案研究时，每一种传承会优先考虑哪些 
格值。定性传承会优先选择（1， 1) 单元，在这个单元中，原因和结果都 
有呈现。这种传承也不愿意选择来自（0, 0) 单元的个案，因为这种单 
元对于评价集合论假设没有多大力度。相比之下，定量传承通常认为 
所有的单元都是重要的 ( Seawright ， 2002)。 


14.2 基于因变量进行选择 

定量学者为定性研究者提供的最生动、最著名的建议之一是，根据 
个案在因变量上的极值来选择个案是危险的。阿肯和斯尼达尔 （Achen 

and Snidal , 1989:160— 161) 将这种极端个案的选择-诸如乔治和 

斯莫克 (George and Smoke , 1974) 决定主要关注战争而不是和平- 

看成是冒了“推断谬误”的风险，它对研究发现的效度带来“破坏性的后 
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果”。格迪斯 ( Geddes ， 1991;也可参见 Geddes ，2003) 指出，基于因变 
量来选择个案是一种“禁忌”，它“蛊惑着”很多重要的定性研究，包括斯考 
切波对社会革命的分析。有关基于因变量的个案选择研究在金、基欧汉 
和维巴对此问题的讨论处达到高潮，这就是本章开篇所引用的导语。 

这种批评的统计学基础已经在文献中有良好的阐述，尤其是赫克 
曼的文章 （ Heckman ， 1976； 1979)。在双变量关系中，与使用因变量 
的全部变异相比，选择在因变量上被删节的一个样本会产生一个平稳 
的斜率。因此，用删节过的样本来估计回归线会导致系统的误差（即偏 
差）。这种说法的寓意在于，研究者选择的个案样本不应该都处在因变 
量的一个有限范围内。在定量传承中，此建议无须争议，并且如果处理 
的是典型的线性回归模型的话，这一点就更容易理解。 

如果研究者所用的因果模型更具有定性研究的特征，那么这个建 
议就不太恰当了。例如，考虑如下因果模型 ： Y = ( A * B * C ) + 
( A * C * D * E )。 在这个等式中， A 是 y 的一个假定的必要条件。如 
果有人想要验证关于 A 的这个假设，那么哪种个案选择策略是合适 
的呢？ 

为了回答这个问题，回想一下第2章给出的关于必要原因的定义， 
如下 所示： 


P(X = l I y = l)=l ( 14 . 1 ) 

注意该等式要说明的是 :考虑 y = i 的所有个案，并分析它们是否都满 
足 x = i 。 如果满足，则此证据就会支持必要条件假设。当然，这意味 
着是在因变量基础上的选择;它意味着选择这些个案恰恰是因为它们 
都满足 y = i 。 

J . S . 穆勒 ( Mill , 1843, 1974) 的求同法是思考这种设计的一个传 
统方式，该方法作为一种策略可用来考察关于必要条件的假设。最近， 
方法论者又探索了研究者必须考察多少个相符合的个案（即 Y =1 的 
个案也满足 X = l ) 才能确信假设是有效的 （ Dicm ， 1998； Braumoeller 
and Goertz , 2000； Ragin ，2000)。 从我们此处的目的角度讲，关键在 
于，当在定性研究中检验必要条件的时候，基于因变量来选择个案要直 
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回归线 


接遵循关于必要条件的定义。① 

为了分析定性的个案选择规范和统计传承之间的冲突，可以考虑 
格迪斯 （ Geddes ， 1991， 2003) 关于选择偏误 （selection bias ) 的文章。 
格迪斯考察关于东亚地区（如韩国、中国台湾和新加坡)持续快速经济 
增长方面的定性文献中的问题。她观察到，当分析者在解释高度增长 
时，经常强调政府在创造训练有素且沉默的劳动力（即“劳动力压榨”) 
方面的角色。然而，这些学者在做出这种因果推断的时候，利用的证据 
只来自保持高度增长的一些国家。她建议，由于这些学者只选择极端 
的个案（即高度增长的个案），他们的发现会受限于选择偏误。她提岀， 
如果在选择个案时不考虑其在因变量上的值，那么在劳动力压榨和经 
济增长之间可能出现不同的关系。 

为了从经验上指出此点，她用发展中国家的一个大样本来展现 
人均 GDP 和劳动力压榨之间的双变量数据。她提供了 1970年人 
均 GDP 高于韩国的32个发展中国家的数据，图 14.1 再现了该数据 


劳动力压榨 

图 14.1 基于因变量的选 择：劳 动力压榨和经济增长 


① Y = 0的个案会在评价必要条件的假设上发挥作用，虽然这一点超出了本讨论的 
范围。特别是，它们帮助学者从不重要的必要条件中区分出重要的必要条件（参见 Bran - 
moeller and ( ioertz , 2000； Goetrz . 2006； Ragin , 2008) 0 



人均 GDP 增氏 百分比 
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( Geddes , 2003:104)。正如图中的平缓回归线所示，这些数据并没有 
线性关系（斜率是0.09, 尺 2 =0.003)。因此，当格迪斯看到图 14.1 的散 
点图后，她认为劳动力压榨与经济增长无关。① 

然而，从集合论的观点来看，该数据的确表明在劳动压制和经济增 
长之间可能有重要关系。数据有一个空白区域•在图 14.1 的左上半区 
域没有观测值，这个事实值得我们重点关注。如果下面的假设是正确 
的，那么空白区域就是研究者期望要看到的 ：劳动 力压榨是经济高速增 
长的必要条件。因此，虽然数据不支持线性关系假设，但是它们的确与 
必要条件假设相一致。所有的经济异常增长的个案都至少有中等程度 
的劳动力压榨(墨西哥这个个案有较低水平的劳动力压榨，但有高度增 
长）。因此，在这个总体中，至少中等程度的劳动力压榨对于持续高度 
增长来说是必要条件。头脑中武装了集合论因果模型的定性研究者不 
能不注意到数据的这个方面。 

有趣的是，如果回过来看提岀劳动力压榨是持续高度增长的原因 
的最初学者，会发现他们趋于从必要条件而不是一种线性协变模式的 
角度来思考关系。例如，戴约 ( I > yo , 1987:182) 写道，“训练有素、低成 
本的劳动力……已成为发展的先决条件”。库 （ Koo , 1987: 174) 断言 
道，“对工业劳动力的控制和规训……是边缘国家必须提供的条件，这 
些条件可使外国资本的投资环境优化，同时促进国内资本的商业自 
信”。这些引文使用了经典的必要条件语言（例如，“先决条件”、“必须 
提供”）。因此，格迪斯的数据似乎与新兴工业国家的学者提岀的实际 
假设相一致。 

总之，个案选择是一个依赖于模型的 问题； 为了检验所研究的假设 
的经验意义，研究者必须选择个案。如果模型提岀了 一个必要条件， 
一个好的策略就是选择 Y = 1 的个案。如果假设涉及一个充分条件， 
最好的个案通常是 X = 1 的那些。如果假设预设有一种可加的线性模 
型，那么这些个案选择的模式就是不恰当的了。 


① 这电直 接有一个担心，即格迪斯的例子表明选择偏误导致定性研究者在他们的 
被删节的样本中高估了真实的关系强度。然而，就双变量来说，选杼偏误应该在删节的样 
本中产生一种弱的关系。 


2( ) ( ； 
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14.3 选择个案的策略 

在本节中，我们将用表 14.1 作为一个程式化的例子来说明观 
点。该表中包含两个二分变量，原因变量 X 和结果变量 Y 。 （0, 1) 
单元中没有原因但有结果，可视之为必要条件单元，因为存在一个必 
要条件，该单元必须是空的。（1， 0) 单元是一个充分条件单元，其中有 
原因但没有结果，因为如果充分条件存在，该单元必然为空。（1， 1) 单 
元包含的个案都既有原因，也有 结果； （0, 0) 单元的个案都缺乏原因和 
结果。 

表 14.1 


Y= 1 

y = 0 


14.3.1 随机选择 

在定量传承中，标准的个案选择策略是随机选择。如果研究者要 
选择大量的个案，这种选择策略就有很多优点。最基本的优点是，随机 
选择确保了个案选择过程与因果模型中的任何变量都无关。用表 14.1 
的术语讲，大量个案的随机选择确保了没有任何单元被给予优先权。 
当检验一个统计模型时，这种数据恰恰是人们想要的。 

然而，当研究者进行小样本的个案研究时，随机选择的效用就有争 
议了。费伦和莱廷 (Fearonand Laitin ，2008) 主张，当评估回归结果的 

因果机制时，可对小样本的个案研究实施随机选择。他们认为，非随机 
选择的个案研究很少令人信服，因为我们不能确信，研究者是否“挑选” 
( cherry - picking ) 了那些预先了解的个案来支持假设。另外，仅仅因为 
人们拥有关于这些个案的好数据或知识而选择它们，这种做法引岀了 


用于个案研究选择的单元 

X = 0 X = 1 


(0, 1) 

(1， 1) 

(0, 0) 

(1， 0) 


210 




14 个案选择与假设检验 


代表性问题。他们相信，这种代表性问题也适用于研究者在选择观测 
项时所采取的策略，因为这些观测项在自变量和/或因变量上有值。为 
了回应这些问题，并进行更客观的检验，他们敦促个案研究者使用随机 
数生成器来选择他们的个案研究。 ® 

不岀意外，定性学者几乎从不使用随机选择策略。 ® 这些研究者会 
部分基于个案在特殊变量上的值而有目的地选择个案。他们之所以这 
样做，一个重要原因在于 ，一 定类型的个案会比其他个案在检验他们的 
因果模型方面提供更大的影响力。 

现在，想象一位要检验关于必要原因的假设的学者。此时，图 14.1 
的(0, 1) 单元就非常重要了。该单元中的任何个案都会被证明是不成 
立的。毫无疑问，研究者会审视这些个案，分析它们是否真的挑战了假 
设。他/她会探索，这里是否存在着测量误差或者是否有未预料到的因 
果机制。 

另外一个重要的单元是（1， 1) 单元。研究者期望从其中的个案中 
看到将必要条件与结果连接起来的因果机制。定性研究者会详细探究 
(1， 1) 个案，以便发现它们是否符合预期。在定性分析中，研究的主要 
目的是解释 y = i 的个案，因此，要密切关注那些也拥有一个可能为真 
的必要原因的 y = i 的个案，这是研究者的完全自然的想法。 

在（1， 0) 单元里存在着必要条件，但不存在结果，该单元的用处不 
大。但它还是能帮助研究者探索感兴趣的因果机制。研究者利用这些 
个案，可能期望必要条件显示出其因果功用来，即通过移除障碍或创造 
机会来促成结果或使结果成为可能。尽管由必要原因呈现岀来的这些 
可能性在结果中不会达到顶点，但是检查它们是否会呈现仍然是合适 
的。困难在于，必要条件的因果机制可能难以观测到，因为其他重要条 
件的缺乏会阻碍结果实际发生。 


① 在评估不同的个案选择策略时，赫伦和奎因 （Hermn and Quinn ，2011) 发现，相对 
于立意个案选择策略来说，随机选择的效果更好。 

② 正如金、基欧汉和维巴所言 :“定 性研究者经常(适当地）改变随机选择的概念，拒 
绝错过重要个案的风险，这些个案可能因随机选择而不被选中。” ( King，Keohane and Ver 
ba ， 1994：125) 
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最后，定性研究者关于（0, 0) 单元的观点是十分矛盾的。他们因 
这一单元而分成两个不同的方向。一个方向是，选择可以是检 
验必要条件假设的一个好方式。这样的一个假设可以对这些个案做出 
清晰的 预测: y 不会发生。另一个方向是，在这些个案中，大多数都与 
检验关于必要条件的假设关系不大 （Braumoeller and Goertz ， 2002； 
Clarke , 2002; 也见 Seawright , 2002)。 例如，在随机选择规则下，可以 
证明(0, 0) 单元是尤其有问题的。在定性研究中，这些单元经常充满 
着个案，因此，随机选择的话会选岀（0, 0) 单元中的许多个案。在这个 
单元中有很多个案，因为定性研究者通常研究少见的结果，因而使得 
Y = 0 的个案数远大于 Y =1 的个案数。在有问题的(0, 0) 单元中，个 
案总量将取决于必要原因 X 的分布，但是，通常（0, 0) 单元是最受欢 
迎的，因为通常情况下，学者会研究那些不常呈现的必要原因。① 

与定性传承的实践相比，赫伦和奎因 （Herron and Quinn ， 2011 ) 
发现，因其极值或不寻常值而选个案，这样的个案选择策略对于评价统 
计假设是最没有帮助的。他们使用如表 14.1 所示的 2 X 2 表总结道， 
从总体稀少的单元中选择个案的策略是需要避免的。“从纯统计抽样 
的视角看，关注那些不代表作为一个整体的总体的个案是资源的巨大 
浪费。虽然这样的个案可能对于探索性分析和/或理论建构是有用的， 
但是，根据定义，它们可提供的关于总体层次的平均因果效应的信息量 
是有限的 ” （Herron and Quinn ， 2011:13)。然而，正如我们所见，在评 
价集合论的假设时，最有用的单元总体通常是稀疏的。例如，在必要条 
件假设下，很有用的(0, 1) 单元并不“代表作为一个整体的总体”，因为 
必要条件假设说的是该单元应该为空。并且，通常有最多观测值的单 
元， g |](0, 0) 单元是最无用的。 

在此，我们的观点是，个案选择依赖于因果模型和研究目标。一个 
观点是，我们研究的是平均处理效应，赫伦和奎因 （Herron and Quinn . 


①当定性研究者研究充分条件时，提供最大影响力的那些单元稍有不同。对亍这 
些假设来说,（1， 0) 单元现在就非常重要 r •因为这一单元中的任何观测值都会否证该假 
说。 证明 （1， 1) 单元中的观测值仍然很重要。在（0, 0) 单元中的个案基本 上与检 验关于 
充分条件的假设无关，因而通常也不被选来进行个案研究分析。 
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2011) 围绕这个观点明确地建构他们的分析。因此，他们的结论和建议 
不能与那个特定的研究目标相分离。同样，在定性研究中，我们关于个 
案选择实践的讨论也假定我们处理的是集合论假设。定性的选择实践 
只有在那样的情境中才有意义。 

14.3.2 实质重要的个案 

另一种考量涉及研究者应该选择的一些特定个案，即一旦抉择， 
一 组个案就是有用的。例如，在（1， 1) 的个案中，定性研究者应该选择 
哪些个案呢?按照费伦和莱廷 （Fearon and Laitin , 2008) 的观点，人们 
可能建议在这些个案中随机选择。该建议再一次建立在来自大样本 
( large - N ) 分析的观念之上，其中不存在事先 (ex ante ) 重要的个案。随 
机选择帮助研究者避免有意或无意地挑选那些支持有利结果的个案。 

然而，定性研究者即使在来自一个有用单元（例如， ( 1，1 )) 的个案 
之间，也从来不用随机选择。相反,他们经常选择自己非常熟知或很容 
易熟知的个案。在定性传承中，熟知一个个案可以显著地增进个案内 
分析(参见第二部分）•提升人们做出有效推断的机会。 

定性研究者相信，除了考虑个案的专业知识的价值之外，有些个案 
比其他个案更有“实质重要性”。如果使用随机选择，选择到这些实质 
重要的个案的儿率通常较低。实质重要的个案经常是一种现象的“理 
想型”或有名的示例。同样，具有特殊的规范旨趣或具有重要政治角色 
的个案可以被认为有实质重要性。 

好的定性理论必须能够解释实质重要的个案。不能解释时，对它 
们不利。毕竟，如果研究的目的是准确地解释个案，那么一个理论在解 
释重要个案上的能力应该得到高度评价。只能解释较少个案的理论则 
较少受认可。格洛德斯通 （ Glodstone ， 2003:45— 46) 提供了一个很好 
的例子，他讨论了马免思主义理论不能充分解释法国大革命的 后果: 
“马克思主义观点可能在其他个案中仍然成立，但是当发现它不能解释 
历史上最重大的一次革命(即在当时最大、最有影响力和最有效仿性的 
国家中发生的这次革命，并且它常常是马克思主义理论的范本）时，当 


213 




两种 传承： 社会科学中的定性与定量研究 


然会动摇人们对该理论的价值的信念。” 

从统计的视角来看，相比之下，规范的做法是当检验假设时所有 
的个案都应该被先验地赋予同等权重。由于理论的目标不是解释特 
殊个案，而是将因果效应向大样本推广，因此，就没有理由特别关注特 
定的个案。当评价一个变量在社会革命上的效应时，法国大革命不应 
该算做例外。如果很多其他个案是符合的，那么法国大革命的不符合 
就不是一个特殊问题，或者至少不比其他革命——如玻利维亚革命 

(Bolivian revolution ) -更成问题。因此，从定量传承的视角看，定性 

学者对实质重要个案的担心似乎令人困惑。 

14.3.3 使用跨个案证据来选择个案研究 

在多元方法研究中，挑选个案研究的时候，标准的策略涉及使用跨 
个案的证据来区分尤其有用的个案。大多数此类文献都假定研究者首 
先进行大样本的统计分析，然后用其结果来分出个案研究（例如， 
Lieberman ， 2005； Seawright and Gerring , 2007， 2008)。 出于同样的 

原因，挑选岀个案研究作为一个随机样本•.在感兴趣的维度上要有代表 
性和变异性。当研究者努力运用个案研究的时候，通常要假定这有助 
于他向一个得到良好界定的大的个案总体做推广。在这一情境下，个 
案研究既可精炼又能检验统计模型。 

在多元方法方面的文献中，个案选择策略菜单中有多种选项（例 
如 ， Seawright and Gerring , 2007提岀了 9种）。这里的假定在于，对个 

案研究的分析将涉及定性研究。然而，也有假定指出，统计模型中变量 
效应的估计值是分析的起点和结点。因此，个案选择的过程完全依赖 
于统计模型。例如，选择一个“典型”或“在线”个案的策略涉及发现一 
个低残差 ( low - residual ) 的观测，此观测项在因变量上的值或多或少匹 
配着它的回归预测值。“异常”或“离线”的个案则是残差高的个案，它 
在因变量上的值与回归预测值不接近。我们相信，这些类型的个案研 
究作为回归研究的补充是十分必要的，并且多元方法方面的文献很好 
地阐释了其原因 （ Collier，Brady and Seawright , 2010) 0 
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对于探索集合论假设的定性研究来说，哪些定量的多元方法个案 
选择策略最有用？ 一方面，可以简单地认为这些策略与这种研究无关。 
在这些技术中，大多数都与关于必要条件和“充分非必要条件的必要非 
充分部分 ”（INUS conditions) 的假设很少相干。此外，某些定性研究 
甚至无意于向大总体推广。在已知它们的范围有限的情况下（参见第 
16章），定性研究者有时候在大多数或全部相关的总体中进行个案研 
究。因此，从大总体中选择个案研究，这种想法恰恰可能不适用。 

然而，另一方面，有些技术可以延伸到定性研究中来评价集合论假 
设。一条基本规则是使用在线或离线的个案，这条规则修正后可应用 
于集合论的情境中（参见 Schneider and Rohlfing， 2010)。例如，我们 

可以回到图 14.1 中的格迪斯数据。其中的假设指岀，至少适当的劳动 
力压榨对于高度增长来说是必要的。就这个假设而言，所有的个案都 
“一致”，可能墨西哥是个例外。然而，在这些一致的个案中，并不是全 
部都应该看做在线的例子。真正在线上的个案是那些有原因和结果的 
强实例。因此，位于右上区域的个案才是“典型个案”的最佳候选者。 
在格迪斯的数据中，巴西、马来西亚、新加坡、韩国、叙利亚和中国台湾 
是6个高劳动力压梓和高增长的国家和地区，因而是最佳的在线个案。 
除了叙利亚以外，在关于新兴工业化国家 （newly industrializing coun- 
tries， 缩写为 NICs) 的文献中，它们也是常常被选择的个案。① 

在西赖特和耶林 (Seawright and Gerring, 2007) 讨论的策略中，可 
能有两个策略最容易应用在定性研究中，它们是“关键个案” （critical 
case ) 策略和“途径个案 ” （pathway case ) 策略（也可参见 Gerring, 
2007)。®关键个案被定义为是那些“最可能或最不可能展示一个既定 
结果”的个案 （Seawright and Gerring， 2007:89)。在讨论图 14.1 的时 
候，我们指岀有一个特殊单元对于关于必要或充分条件的假设有重要 
后果。这个单元中的个案就是关键个案，因为它们最不可能展示出所 


① 相比之下，离线或偏离的个案则位于散点图的左上象限（在格迪斯的数据中，不 
存在主要的离线个案）。 

② 两赖特和耶林在后续研究中设定的明确0标是向大样本总体做推广，其中放弃 
r 这两种策略。参见西赖特和耶林 (Seawright and Gerring ， 2008) 0 


215 




两种 传承： 社会科学屮的定性与定量研究 


关注的结果（即这些个案缺乏一个必要条件）或最可能展示岀结果（即 
个案具有一个充分 条件) 。① 

相比之下，途径个案被定义为是那些 “ Xi 而非 x 2 可能已经产生 
一个正向结果的个案。这些个案研究的目的是探究因果机制 
而不是检验一般的命题。我们相信，这类个案研究在定性研究中很普 
遍。个案研究的中心目标通常是评价备择的论点，需要利用过程追踪 
法来探究因果机制。就图 14.1 而言，通常在（1， 1) 单元中可以发现途 
径个案。研究者分析的个案要有（多个)原因或所关注的结果，其目标 
是决定因果过程在个体观测值内部是否如预期那样起作用。由于这类 
个案研究非常普遍，因此，它本身在第9章中得到了实质性的关注。 


14.4 结论 

本章的讨论表明，个案选择的规则要服从研究目标。在定性和定 
量研究之间，研究目标的不同导致了不同的关于最佳个案选择策略的 
观点。 

首先，在定量传承中，随机选择受到高度欢迎，并且是选择大样本 
个案完全适用的模式。这一选择策略在 2 X 2 表中没有特别偏好的单 
元,并且可以避免统计分析中的偏误。然而，如果检验的是一个集合论 
假设•那么特定种类的个案要比其他个案更加 重要； 并不是所有 2 X 2 
表中的单元都有同等重要性。因此,在定性研究中，研究者通常对某些 
单元而非其他单元的抽样有很强的偏好。 

其次，一旦认定一组个案在分析上是有用的，定性研究者便经常诉 
诸那样的个案，他们有关于个案的专业知识并且能最有效地执行个案 


①尽管关键个案策略在定性研究中很常见•但它可能不总是统汁分析的好的补充。 
在赫伦和奎因 （Herron and Quinn ， 2011 )评价西赖特和耶林的策略时，他们对一种版本的 
关键 t 案策略持有消极观点•认为它是“无成功希筚”的，因为这种策略要求先对结果仃很 
深的认识。 
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内分析。除此之外，他们经常极为关注实质重要的个案。这与定量研 
究有很大差异，后者并不会基于规范的或历史的身份而赋予特定的个 
案以特殊的权重。这种差异根植于两种传统的对比性的研究目 标:定 
性研究者旨在解释特殊个案，因此十分在意某些特定的 个案; 定量研究 
者则试 图估计大总体内的平均效应，因而不会在意特定的个案本身。 

最后，当评价一个关于平均效应的大样本 （ large ~ N ) 假设时，有关 
选择个案的定量多元方法文献提供了一系列有用的策略。然而，其中 
的很多策略不能没有问题地推广到定性研究中来检验集合论关系。它 
对于选择“典型的”或“偏离的”个案来说意味着仆么，取决于正待检验 
的因果模型。在统汁模型中，这些类型个案的定义要考虑它们的残差。 
但是在一个集合论假设中，典型的个案将是同时呈现原因（或者原因序 
列）和结果的观测项。偏离的个案（就必要条件来说)是有原因但无结 
果的观测项。在此方面，“典型”和“偏移”的意义恰恰依赖于研究者是 
在使用统计模型还是集合论模型。 
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概括 


概括 ： 1. a. 归纳为一般的形式、类别或规律。 b . 排除不确定 
性或不具体性。 2. a. 从殊相中推断。 b. 从……中得出推断或一 

般性的结论。 3. a . 使 . 总体上或普遍地可应用。 b . 使 . 

普及。 

—— 《美国传统英语词典》 

覆盖律有一个令人尴尬的 不足 ; 在如生物学、心理学等科学和 
社会科学中，几乎没有什么可观测的规律被认为是解释性的。 

- 彼得 • 赫德斯特伦 (Peter Hedstrom) 

彼得里 • 于利科斯基 （Petri Ylikoski) 


15.1 导言 

大多数社会科学家都想对世界做出概括。研究任务的核心目标是 
生产能够超越时空的概念、模型和理论。然而，不管是哲学文献，还是 
社会科学方法论文献，都对概括可以采取的特定形式所言甚少。在本 
章中，我们比较在定性和定量研究中使用的典型概括模式。 

第一个问题是追问，人们所说的 “ 概括 ” 是什么意思？很多人会认 
i 只到描述性概括与因果性概括之间的差异（如 King, Keohane and 
Verba, 1994) 。 描述性概括经常涉及一个变量，它在一个总体中“描 
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述 ” 事件的某种状态。例如，研究者可以做一项凋查，并用其发现得出 
概括性 结论 : 在特定的一天 • 50 % 的美国人对奥巴马总统有好感。相比 
之下，因果性概括总是涉及至少两个变量， A 和 / 九理想条件下，因果 
性概括会指出在一个总体中 A 和 B 的关系形式和强度。 

在定性和定量传承中.研究者做出的因果概括可以假定采取不同 
的形式，至于什么才算做强概括，他们也采纳了对比性的理解。定量研 
究者使用关联性和平均处理效应等观念来思考概括。相应地.槪括的 
优势与关联强度和处理效应的规模有关。 

相比之下 _ 在定性研究中，因果性概括经常假定采用一个集合论形 
式 : “ 所有 / 没有 A 是 B 。 ” 当然，有时候有一些反例，因此研究者会使用 
如 “ 差不多 ” 或 “ 几乎 ” 全部或者没有 A 是之类的语言。例如，有人可 
能注意到 • 在民主政体的国家从来不发生种族灭绝事件。这会导致这 
样的概 括 :“ 所有的种族灭绝事件都是非民主国家的事件 。” 

因此 • 在每一种传承中，有力的（因果 ) 概括意味着不同之事。在定 
量传承中，它意味着变量之间有强的相关或处理效应。在定性传承中， 
它意味着一个类別中的成员资格对于另一类别中的成员资格来说是必 
要的，或者说是保证性的。 

两种传承相互很难看到和分析对方的典型类型的概括。定性方法 
的设计不是为了发现相关、关联或平均处理效应。就此而言•标准的统 
计方法的设汁也不是为了研究集合论的概括。在本章中，我们会指出， 
在相当多的文献中存在着几乎完美的集合论概括的例子。尽管这一发 
现可能使某些吃惊，但它在定性研究中是可以理解的。 


15.2 定性的概括 

在定性研究中，集合论关系与必要及充分条件有着密切的亲和性。 
在集合论语言中， “ 所有的 A 都是意味着 A 是 B 的子集。用逻辑学 
术语来陈述 . 即 B 是 A 的必要条件。有趣的是，这些概括有着基本的 
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蒗盖律形式。例如，蕴含在民主式和平中的因果性概括很容易被转化 
成律则式的覆盖律 （ canonical covering law) 形式（例如， Hempel ， 
1942 ； Hitchcock and Woodward ， 2003) : 


民主国家之间不发生战争。 

美国和加拿大是两个民主国家。 

因此， 

在美国和加拿大之间不会发生战争。 

在科学哲学中，规律通常采用集合论的概括形式。例如，阿姆斯特朗 
(Armstrong ， 1983) 关于 “ 自然律 ”（ laws of nature ) 的著名分析最关注 

如下观点，即覆盖律意味着所有的 F 都是 G 。 准确地说，“所有/没有 
A 是 B ” 这样的强概括是覆盖律的潜在候选项。 

毫无疑问，一些读者关注的是，像“所有/没有 A 是/3”这样强的概 
括在社会科学中很少或不存在（尽管在自然科学中可能存在）。然而， 
我们在研究和阅读过程中，时常发现这些集合论的经验概括的例子。 
下面的列表反映了我们感兴趣的主题，如国际冲突、内战、民主和经济 
发展。为了强调这些概括中的“全部”或“没有”用语，我们在相关的语 
词上加黑显示。 

普遍选举权的引入在几乎所有地方（美国除外）都导致了社会 
主义党的发展。 （ Duverger ， 1954:66) 

民主国家中没有饥荒。（我们改版的 Dreze and Sen， 1989 
观点） 

富裕的民主制（几乎）不会转变为威权制。（我们对 Przeworski 
et al. , 2000 的著名发现的表述） 

自第一次世界大战以来， 没有例 证表明挪有弱制度的不完全 
民主化戽家会参与，更不用说发动一场外部战争……从1945年开 
始，在63个经历了不完全民主转化的弱制度国家中， 没有 一个国 
家发动或者参与过外部战争 。 （Narang and Nelson , 2009:363，重 
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点字为这里所加） 

最后的概括是就态度的系列变化给出一个陈述，这些态度发 
生在我所知道的开始使用大麻寻求快感的每一个个案中。 
( Becker ， 1953:236) 

我们表明，至少在拉丁美洲，没有哪一个国家的民主是因为选 
择使用（人权）试验而受到破坏的 。 （Sikkink and Walling ， 2007: 
442) 

有组织的工人阶级几乎在任何地方的民主发展中都是一个重 
要行动者，仅有的例外是存在于一些小国家中的少数农业民主。 
(Rueschemeyer, Stephen and Stephens ， 1992 : 270) 

经济危机伴随着这里述评的每一次转型，这当然不是巧合。 
这一模式说明，经济危机对于威权政体的破裂来说可能是一个必 
要尽管不充分的刺激。 ( Bermeo , 1990:366) 

的确，自第二次世界大战结 束以来 ，总统的党派性对收入不平 
等显然有一致的影响。在此期间，在六位共和党总统中每一位的 
治理下，80/20的收入比提高了。相比之下，在五位民主党总统 
中，有四位总统（除了吉米 • 卡特以外）的主政带来收入不平等的 
降低。 （ Bartels ， 2008,引自 Tomasky ，2008:45) 

第一，只有国际化的坚定反对者才在东亚地区追求核武 
器，……第二，在中东地区，所有的核项目都被领导者所启动，这 
些领导人操纵着进口-替代和相对封闭的政治经济。 （ Solingen ， 
2008：18) 

在过去的二十年里，发起自杀式运动的每个小组都有一个主 
要目标，……迫使在被恐怖分子看做自己祖国之处驻军的外国势 
力撤离。 （ Pape ， 2005：21) 

在2001年到2005年间发生的38起活跃的武装冲突中，仅有 
一起发生在世界上1/4的富裕国 家中； 基地组织在2001年9月11 
日袭击了 美国 。 (Buhaung and Gleditsh ，2008:218) 

其中的一些概括是相当著 名的； 实际上，在社会科学中，很多最重要的 
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发现都是集合论的概括。如果我们很留意这些概括的形式，不难发现 
更多。 

在定性方法论中，穆勒的求同法 (methods of agreement ) 和求异法 
(methods of difference) 是研究个体变量之间关系的集合论工具。当 
表述因果概括的时候，自然要考察所有 Y = 1 的个案，观测当 Y 出现时 
是否有某个普遍的因素 X 也总是出现。对于求同法来说，这是标准的 
方案。用我们的术语来说，求同法被用来寻求这样的 X ，即使得“所有 
的 1 都是 X = 1” 。贝克尔 (Becker ) 的名篇就是这方面的一个经典 
例子。他的注意力是关注一些为求快感而吸食大麻的人，发现了他们 
中间普遍具有一系列行为。 

在其中的一些例子中，作者在解释集合论概括时，认为它反映了一 
种因果关系。例如，贝尔梅奥 （ Bermeo) 认为，在危机和威权政体的崩 
溃之间存在一种因果关系。她利用集合论的经验概括支持这一观点。 
显然，想要确证这种因果解释 v 她就需要进行额外的分析，如个案内分 
析和过程迫踪。但是，概括本身就支持 T 一 ' 个变 M 引起另一变量的 
观点。 

最后需要强调的是•进行这些概括的学者都假定它们适用于某些 
情境而非其他情境。的确，定性概括的范围经常是相当受限的（参见第 
16 章）。此外，很显然其中的一些概括都有例外。因此，当学者提出一 
个遵循集合论形式的概括时，他们不认为概括就像宇宙的一个规律那 
样不能被违反。 


15.3 集合论概栝和 2 X 2 表 

由于集合论的（因果）概括包括两个变量，因而很容易用 2 X 2 表来 
呈现这种概括（出于本章的目的，假定变量或概念是二分的）。表 15.1 
利用了我们在下一节继续使用的一个 例子； 它是戈曼斯 （ Goemans ， 
2000) 的一项研究，探讨了国际危机和战争结束后领导人的命运。一个 
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因变量是领导者在战争结束后是否受罚（即被流放、监禁或杀掉）。关 
注的一个关键自变量为外国势力是否推翻了原有的政权。表 15.1 汇 
总了我们的双变量发现。 

表 15.1 集合论的概括 :强加 的政权更迭后领导人的命运 


受惩罚 
不受罚 

资料来源 : C ^ oemans ， 2000 0 

这个表表明，有一种简单的方法可以发掘强的定性概括，即在 2 X 
2 或 NXN 表中寻找一个空单元 ( 或者几乎为空的单元）。如果存在这 
样的一个单元，人们就用 “ 所有 / 没有 A 是 B ” 这种形式来表示该表格 
的核心关系。在戈曼斯的分析例子中，我们就可以得出结论，即“所有 
外国强加的政权更迭都导致前领导人受罚”。 

在第 2 章中，我们比较详尽地讨论了 2 X 2 表集合论分析对比统计 
分析，因此，我们在这里仅总结两个关键点。 

1. 当面临一个集合论的关系时，不同的统计关联测度将因它 
们解释关系的方式而变。一些常见的 2 X 2 关联测度（如 P ， q ) 
会将这种关系看成是显著的但不是很强。相比之下，发生比率这 
个关联测度会表明一个非常强且显著的关系。 

2. 统计测度通常不在“所有 x 都是 y” 和“所有 y 都是 X” 这 
两类概括之间做出区分。例如，发生比率并不区分充分条件和必 
要条件。 

核心点在于，统计检验不能精确地报告数据的某些特点。相反，关 
键在于设计的这些检验并不是为了分析集合论概括。当然，由于同样 
的原因，集合论工具的设计也不是为了分析在定量传承中通常研究的 
那类对称关系。 


国内强加的£迭外国强加的吏迭 


27 

22 

182 

0 
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15.4 统计模型、完美预测项和集合论概栝 

在统汁分析中有一个众所周知的问题，即我们所谓的“完美预测 
项 ” (perfect predictons) 问题。基本上讲，在极大似然估计中，如果一 
个自变量完美地预测了结果，那么统 it 方程就不能被估计 ( 参见 Zorn ， 
2005 的详尽讨论）。在 20 世纪 90 年代，一些流行的软件包，如 SAS 第 
6 版忽视了这个问题，因而当该问题出现时会产生无意义的结果。目 
前的统计软件包会提出警告（如 SAS ) 或者通过警告将干扰变量从模 
型中移除 ( 如 Stata) 。 在 R 平台下 • 软件会估计这个模型，并把它留给 
研究者，让其通过注意异常大的标准误来发现该问题。 

一旦发现该问题，大多数学者都会从模型中简单地去掉干扰变量 
(Stata 会自动消除）。这样的解会引发我们所谓的完美预言项悖论 
(Paradox of the Perfect Predictor) 0 

完美预测项悖论。通常到目前为止，拥有最强因果效应的变 

量会被从模型中移除。 

学者不关注一个异常的强关系，而把它看做一个需要解决的统汁 
学问题。虽然有一些方法可以处理此 “ 问题 ” ，②但是到目前为止，最常 
见的解是在模型中去掉干扰变量。例如，从统 il •学模型中去除一项的 
理由可做如下考虑 : “IC()W(Issue correlates of War ) 数据的使用要求 

模型设定要有所改变。核心地位之间的交互项被从模型中去掉，因为 
其 0 值也完美地决定了因变量的 0 值 。” （Gartzke and Jo, 2009:224) 


① 在统汁学中（例如 • Hcinze and Schemper • 2002 )，它通常被称为“分离”问题。兒 
美预测项将结果变墩完全分为“0”组和 “ rm 。 一般来说，当在一个给定的单元中行一个 () 
值时•就会发生这种情况。 

② 佐恩 ( Zom ，2005) 讨论了几种针对这些变量获得“更合理的”参数估 it 值的方法。 
01叶斯技术在解决这个问题时.利用先验值使估 m 以然方程成为可能。 
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表 15.2 完美预 测项: 外国强加的政权更迭 


MLEs MPLEs 


变 

_& 

里 

A 

P 

发生比率 
(Odds ratio ) 

A 

P 

发生比率 
(Odds ratio ) 

常 

量 

— 2.96 

(0.46) 

— 

-2.87 

(0.44) 

— 

其他小的战败国 

0.85 

(0.66) 

2.3 

0.85 

(0.63) 

2.3 

其他大的战败国 

3.36 

(1.02) 

28.8 

3.20 

(1.00) 

24.5 

混合政权的小战败国 

2.69 

(0.62) 

14.8 

2.61 

(0.61) 

13.7 

混合政权的大战败国 

3.24 

(0.89) 

25.6 

3.12 

(0.87) 

22.5 

外国强加的政权更迭 

22.85 

(4 840.20) 

8.4 X 10 9 

5.49 

(1.51) 

243.0 


资料来源: Zorn ， 2005:167。 


表 15.2 呈现了佐恩 （ Zorn, 2005) 对戈曼斯数据的分析。如在表 
15.1 中所见，这个完美预测项就是 “ 外国强加的政权更迭”。其参数估 
计值是 8.4 X10 9 •即对这样一位领导人的惩罚比率大约比在没有外国 
干涉情况下被免职的领导人受罚的比率多 84 亿倍。佐恩发现了无限 
大 —— 从数学上讲， 84 亿基本上就是无限大——是一个不合理的估计 
值，并且给岀一些达到更小值的方法。他认为他的修正方法就是“就外 
国强加的政权更迭对战后领导人命运的影响，呈现一幅非常可信的图 
景，， (Zorn ， 2005:167) 。在更 “ 真实 ” 的模型中，发生比率 “ 只有 ”243 ( 参 
见表 15.2) 。尽管 243 远远小于 84 亿，但它仍然很高，以至于这些结果 
对于几乎所有的实践目的来说都意义相同。① 

完美预测项表明这两种传承是如何对同一数据有不同反应的。定 
性学者容易使完美预测项成为他或她的分析的中心。定性学者之所以 


①当标准误很大时，也可作为另一种区分出完美预测项的方式。例如，由表〗5.2可 
见，干扰变量的标准误超过了 4 800。 
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追求完善预测项，是因为其目标是全面地解释自身感兴趣的结果。相 
比之下,在定量领域，分析的目标很可能是估计除了完美预测项以外的 
其他变量的效应。有此目标后.完美预测项的存在就成了一个统计学 
问题，这个问题会要求剔除变量，或者引人其他的方法来解决。 


15.5 控制变量和完美预测项 


很多文献都论述了有观测数据的因果推断，大多数都关注混淆变 
量问题。加入一个新的控制变量后，一个关键的统计发现会消失，这种 
情况总可能发生。具备怀疑精神的评论人很快会指出作者可能没有加 
入一个关键的控制变量。经济学家可能着迷于这些忽略变量偏误问 
题，因而要针对每一年及每一个区域的截面加入控制和固定效应。正 
如利伯森和林恩 所言： 

影 响因变量成立的条件或因素几乎有无数个（用当代社会学 
语言来讲）。如果一次调查产生了一种复杂的分析，其中比如要考 
虑15个变量，那么在当代的分析中一个完全可以接受的提 议是: 
将第16个变量也考虑进来。“控制”了额外的属性或许会完全改 
变先前得到的结论，这种可能性总是存在的 。 （Lieberson and 
Lynn ， 2002： 8) 

由于统计结果对特殊的模型设定有敏感性，因此，近些年来，为社 
会科学期刊撰写稿件的作者们常常不惜笔墨，用大量篇幅展现“稳健 
性”分析。这些讨论通过改变统计分析中的诸多核心特点来分析主要 
变量是否保持其符号并在统计上显著，以此来处理统计发现的脆弱性， 
不过这些讨论常常被重要的网址所遮蔽。 

相比之下，定性传承中提出的集合论概括本质上是双变量的概括， 
不要求加入控制变量。在关于必要性或充分性的声称中内含着这样的 
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假设，即其他变量或变量组合的效应都不能胜过一个必要和/或充分原 
因的效应 (Seawright ， 2002:181) 。实际上，集合论概括对于虚假相关 
问题来说是稳健的。总之，我们不必担心额外引入的变量会消除原来 
的 关系： 


控制变量或混合变量不会使一个强的集合论概括失效。 ( f) 

想要明白为什么这是正确的，可以回想一下，控制变量要在一个总 
体的子群体内部寻找差异性的关系。但是，当关注点从全总体转向子 
总体后 • 集合论概括仍保持稳定。如果对于总体 Z 来说 , 所有的 A 都 
是 /i ， 那么对于 Z 的所有子总体来说，同样的概括依然成立。在全总体 
中的一个完美预测项在子总体中也是一个完美预测项。 

考察表 15.2 中完美预测项的因果影响，我们也可以直觉地看出这 
一点。发生比率或者本质上是无穷大，或者是非常大，达到 243 。虽然 
可以引人不同的控制变量，使用固定效应或者做其他的模型调整•但是 
因果效应也不大可能消失。就实际的完美预测来说，加入的控制变量 
将不会有影响 D 如果集合论概括有一些反例，估计的参数值会降低（由 
于有多重共线性），但是即使在这里，控制变量通常也不会有太大影响。 


15.6 结论 

强概括的观念在定性和定量传承中有不同的意义。就定性传承来 
说，它意味着一种集合论的关系，大致采取这样的 形式 : “ 所有 / 没有 A 
是 /3 。 ” 相比之下，在定量传承中，强概括观念表明在两个变量之间有强 
的统计相关，或者存在一种实质上和统计上显著的平均处理效应。 

这些不同类的概括与两种传统的总目标紧密相关。定性研究者经 




①如果控制变量本身与概括变 量完全 相关,这就是该规则的例外之处。 
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常寻求全面地解释结果，包括鉴別出对于这些结果来说是必要的因素。 
这种取向相当自然地将本身指向对强集合论概括的追求。相比之下， 
在定量传承中•研究者力图估计一些特殊变量的平均效应。在此目标 
下，一个强概括经常陈述一个因果效应的规模怎样 ，或荇 关于因果效应 
的发现的稳定性如何。 
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一项研究中的被试构成了某个假想的超总体的一个随机样 
本，这个旧观点仍值得片刻敬默。 

- 戴维 • 弗里德曼 （David Freedman ) 


16.1 导言 

由于 “ 范围 ” 一词通常不岀现在方法类著述中，先简要介绍它是有 
益的。来自自然科学的一个简单例子恰好提出了模型拟合和模型设定 
问题，它将是本章的关注点。该例就是物理学的胡克定律 （ Hooke’s 
law) ，即弹簧上的应变 （ strain) 和应力 （ stress) 成比例 （ Freedman， 2009 

把它作为核心例子）。如果在一个弹簧上悬挂一个重物，，该弹簧的长 
度为长度，，那么该定 律为： 

长度,，关 重物， +e t (16.1) 

在 ( 如拉普拉斯和高斯的 ) 古典物理学中， e, 指测量误差，是测量工具、 
测量者和其他因素的组合，该组合使得观测值有别于真实值。 

依照现在的情形，等式 (16.1) 没有范围限定。因此，可以推定胡克 
定律对所有的重量以及在宇宙中所有的空间场域中都适用。只有当分 
析者在该定律的适用性上强加一个或多个限定时，才引人范围条件。 
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针对胡克定律，有两个自然的方法可引入范 I 剩限定。第一种是断 
言该定律只对一定范围的重量才有效。正如物理学家所知，很多“科学 
定律”在极端条件下会失效。在这种情况下，大重物的使用要求分析者 
在等式 （16.1) 中加人二次项。因此，如上所述的胡克定律的范围仅限 
定在某种阈值以下的重物。在该阈值以上 •人们 就需要通过调整模型 
中的变量来修正定律。® 

限定胡克定律的第二个自然的方法是如下断言，即只有当重力与 
地球引力相等时，该定律才有效(或者主张该定律的性质将因与地心的 
距离而变）。这里•人们设定了作为定律起作用的必要条件的“环境”和 
“背景条件”。这个环境实际上是在等式 （16.1) 中没有设定的一个或多 
个隐变量。除非这些变量显现(或者假定取特殊值），否则定律中表述 
的一类关系将不适用。 

由于胡克定律在应用性上受到限定，因此出现了对范围条件的需 
要: 在各类子总体(例如，对于非常重的物体来说.弹簧起作用的方式会 
变）以及各种环境（例如，可替代的重力）中•模型的参数是不稳定的。 
事实上，没有哪个物理学理论会有普遍的适用范围。也许除了量子力 
学的基本理论，所有的理论和概括都对环境敏感，即有范围限定。 
将范围看做这样的一组变量是很有 益的： 

如果范围条件成立，处理效应就是/3。 

在这些 范围条 件以外，我们或许知道或不知道实际的关系是什么•但是 
我们会怀疑或者知道关系是不同的。简言之，一个范围条件就是关于 
因果同质性（即某个领域)的一种主张，在该领域中，可以期望因果效应 
是稳定的。 

不足为奇，社会科学中的理论的范围比在自然科学中更受限定。 
虽然胡克定律很有普遍性，因为该定律适用于大多数重物和地球上的 


①只要重量足够大，所有的弹簧最终都会损坏。这个损坏点就是-类最终分界点。 
当达到这个点时，规律就不适用了。 
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大部分环境，但是社会科学中的模型在不同的子总体和环境中是异常 
脆弱的。在一个子总体或一个新的总体中运行同一个模型，很可能产 
生不同的参数估计值。 


16.2 针对因果异质性问题的模型内回应 

为了避免必须限定范围，学者可以通过改变因果模型来处理模型 
拟合和因果异质性 ( causal heterogeneity ) 问题，即我们所说的“模型内 
反映” ( within-modcl responses ) 0 我们简要地考察其中最流行的一些 
模型内反映。出于我们将探索的一些原因，通过改变因果模型来解决 
因采异质性问题，这种选项对于定量学者来说比定性学者更有吸引力。 
为什么高度严格的范围边界更可能在定性研究而 II •:定 量研究中被发 
现，这就是原因之一。 

16.2.1 定量研究中的回应 

对胡克定律的讨论表明，当在定量研究中遇到因果异质性问题的 
时候，有一种有益的思考方式，即是使用范围条件还是使用模型内 
的解： 


长度重量 + e ， 重量 < S , (16.2) 

长度重量 + 7 * 重量 z + e ， 重量 < S 2 (16.3) 

对于较轻的物体^、，我们有一个简单的等式。如果要增加范围边界以 
便包括更重的物品•即 S 2 , 就需要添加一个二次项。通过加入二次项 

(即重量 2 )，就在模型内部解决了范围问题。 

范围决策涉及我们所谓的基础权衡 (Fundamental Tradeoffs ) 的各 

种形式。虽然它不是我们知道的一个宇宙定律，但至少在社会科学中 
儿 、 P •—定可以避免的是，当人们想要增加任意一个已知的理论（而不提 
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出一个全新的理论 ） 的范围时，修正了的理论会更加复杂 （Przcworski 
and Teune , 1970)。因此，基础权衡会追问 ：在范 围上提升的概括性是 
否值得在简约上有损失（即复杂性增加）。只要损失的简约性造成的代 
价不太高(胡克定律当然不是如此），模型内的解往往就是一个好主意。 

随机化并不是对范围问题的可靠解，注意到这一点很重要。举个 
简单的例子，假设有一个处理 ( treatment )( 如吸毒）对男人有正效应而 
对女人没有效应。因此，个体的性别就是一个范围条件，它界定着这种 
处理得以起作用的个案范围。如果我们没有意识到这个范围，并在所 
有的个体身上运行一个实验或统计模型，也许假定这种处理会对每个 
人都有一个平均效应，而实际上没有。 

一 个自然的反应就是将性别作为控制变量。正如无数哲学家和方 
法论学者所强调的那样，增加控制变量对于产生同质的子总体来说至 
关重要，反过来对于好的因果推断也必不可少。控制变量是我们所谓 
的模型内反映的一个经典例子，因为将范围变量纳入模型会使模型更 
加复杂。因此，研究者可能有如下 模型： 

Y —(]o 7 ' + + e (16.4) 

在这里，当控制 S (性別）时，可以检验了（治疗）的效应。在这个模型 
中，我们将确切地看到，被试的性别是模型的一个重要部分。 

众所周知，引入控制变量能够彻底改变所研究的自变量（即了）的 
参数估计值。在范围情境下，用控制变量可检验子总体内部的因果同 
质性，该子总体是由控制变量的不同值界定的（一个漂亮的直观解释， 
参见 Berk ， 2004:第1章）。如果加入的控制变量改变了参数估计值， 
研究者就会怀疑 X 在整个总体中并没有恒常的效应。在我们的简单 
例子中，当加入性别变量后,会改变。这意味着，处理效应因性别定 
义的子总体的不同而变。 

加入控制变量可改变参数估计值斤，这表明因果异质性是一个问 
题。然而，加入控制变量本身并不能解决问题 :它是 一种诊断工具，能 
告诉研究者因果异质性是一个问题。 

为了捕捉异质性，一个自然的举动是考虑性别和处理的交互项。 
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交互项的系数可真正说明处理对性别的依赖性。它让我们看到处理效 
应完全在男性中起作用。用这种方式加入交互项，使模型变得复杂，这 
是针对因果异质性 （causal heterogeity ) 的模型内解 （ within-model so ¬ 
lution ) 的一个好例子，它停止了直接施加范围条件。①在不必将分析仅 
限定在 S 上的一个特殊值的情况下，可以建立模型来研究 X 的效应如 
何依赖于 S 。 如果潜在的范围条件仅与一个自变量有交互作用，而且 
这个影响可以用一个简单的交互项来正确地建构，那么这种解就很有 
道理。 

一种不同的方法是，在由一个范围变量所界定的子总体中单独估 
计整个模型。例如，研究者可以分别针对男性和女性来估计了的效 
应。如果研究者相信，因果机制在不同的子总体中也相当不同，那么这 
个解就是一个好的选择。例如，在关于国际关系冲突的文献中，分析者 
有时候针对不同的时代分别估计模型，例如，第一次世界大战之前、第 
二次世界大战之后和冷战后（例如 ， Senese and Vascjuez , 2008)。就跨 

越不同时期的很多变量来说，它们的参数估计值的变动通常相当大。 

总之，我们认为，针对因果异质性问题有三种常见的模型内回应， 
它们阻止对范围进行限定：（1)控制变量， （2) 交互项， （3) 在子总体中估 
计整个模型。 （1) 和 (3) 这两个解实际上是诊断工具，用它们可以确定 
因果异质性问题的存在，从而需要限定范围。 （2) 这个解原则上可以在 
不施加范围限制的情况下，实质地处理一个因果异质性问题。 

16 . 2 . 2 定性研究中的反应 

对于定性研究者来说，如果不限定其论证的范围，他们如何回应因 
果异质性问题呢？在这种传承下，也可能用模型内的解来阻止范围限 
定。然而，如在定量传承中一样，这些解常常以模型的简约为代价，从 
而提岀了基础权衡问题。 


①“某种因果关系在个体、情境、处理和结果的变异中 A 多大程度上成立•对它们的 
估 i 十从概念上讲类似于对统计交互项的检验 。” (Shadish et al .， 2002： 86) 
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在定性传承中，一个可能的模型内的解涉及在初始的集合论模型 
中加入一个或多个额外的因果路径。例如，考虑一个定性模型，如 

为了容纳更多的个案，研究者或许会增加一个新的因果 
路径。因此，初始模型可能被修改为 Y = A /9 C + B (7) + f : F 。 为新个 
案增加新路径在多大程度上是值得的，这取决于各种考量•包括在研理 
论的性质以及新路径在多大程度上适用于不止一个新个案。研究者不 
想对每一个新个案都必须增加一条新路径。 

一个模型仅在一个给定的情境中起作用，这个发现也能促使研究 
者在初始模型的 W 果路径上加入新变量。例如•再考虑一下集合论模 
型7=八/;(’ + 2义7)。假设研究者发现，这个模型仅适用于那些具备某 
个特定特征 Z 的单元。研究者可以通过使其成为一个必要条件，将这 
种特征当成模型的一 部分 ： Y = Z^-(AbC + BCD ) 0 除非 Z 出现，否 
则研究者不能期待或 BCD 对于 Y 来说是充分的。 

对于那些不存在 Z 的个案来说，研究者需要确定能产生 Y 的一套 
不同的原因条件。这些新的原因可以与一些理论联系在一起，这些理 
论可以与初始模型中的理论关系不大。例如，研究者或许发现 Y = 
zKF 。 这些新变和 F 也许和来自初始模型的变量无关。然而，新 
模型可以与初始模型结合起来，以避免一个范围限定。最终的结果模 
型将是不太简 约的： Y = ZA/,C + ZB (7 J ) + ； rf ： F 。 

如此看来,无论在定量还是定性研究中•原则上讲，都可以通过修 
正因果模咽来避免限定一个理论的范围。如果已有适当的修正并且它 
们有吸引力一^•即基础权衡是值得的，那么学者就没有什么理由去诉 
渚范围限定。另一方面，如果模型内的改变是不可知的，或者引人了难 
以处理的复杂状态，范围限定就成为一个可理解的替代了。 


16.3 为什么利用范围条件? 


244 


有时候，学者能通过修正他们的因果模型来避免使用高度限定性 




16 范围 


的范围条件，尽管如此，他们最终经常对其模型的范围或明或暗地施加 
了一些限定。在本节中，我们考察因果复杂性的存在以及对数据拟合 
性的关心如何导致学者使用了范围条件。 

16.3.1 因果复杂性 

作为一般规则，我们 建议： 

如果扩张一个因果模型的范围会要求该模型变得相当复杂， 

那么施加范围限定就变成一个有吸引力的选择。 

该提议直接出于这样的观点，即在增加一个因果模型的普遍性和 
使该模型达到最简约之间存在着一种权衡。当分析者判定扩大模型的 
普遍性所带来的收益不抵使模型简约带来的损失时，就经常使用范围 
限定，这种简约性与必须引人的复杂性增加有联系。实际上，分析者通 
常不知道如何修正模型使之涵盖更广泛的个案。那么，范围限定就成 
为设定模型据以运行的领域的必要工具。 

在实践中，范围限定在社会科学中往往非常模糊或者完全不明确 
(在定性和定量研究中皆如此）。学者经常含蓄或偶尔明确地在时间段 
或区域上使用范围限定。在操作的意义上•将范闱限定在一个具体的 
时间段或区域上，这是相对精确的（例如范围仅限于非洲），但是在理论 
意义 h 并不精确。理想上讲，我们可以跨越具休的时空来确定抽象的 
范围条件。 

为什么范围限定在区域和时间段上是被模糊设定的，原因之一在 
于，许多重要的东西会随着时间和区域的变化而变。例如，非洲在很多 
方面不同于拉丁美洲，如气候、人口密度、文化、殖民历史等。研究者也 
许+知道其中哪些具体的差异最重要，以及为什么它们恰好重要。因 
此，当研究者相信范围仅限于非洲乃是根本，他或她就不能确认哪些复 
杂的原因使得该范围是恰当的。模型内的解之所以无用，是因为它们 
要求已经解决了这些理论复杂性。 
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所设计的定性因果模型要适应总体内的每一个个案，这个事实有 
助于解释定性学者为什么比定量学者更容易使用范围限定。就一个集 
合论模型来说，加入一个或少量新个案也许会要求分析者从根本上改 
变初始模型。得到的因果模型的简约性可能大降。此外，学者也许甚 
至不知道通过哪些方式改变模型可以使之容纳新个案中的因果模式。 

举一个假想的例子 ，一 位定性学者不但需要知道当加入额外的个 
案时 D 是一个重要的变量，还要知道这些个案缺失的因果组合是 
仪 ’ D 。 斯考切波 (SkocpoU 1979) 在其著名的社会革命理论中，将范围 
限定在非殖民地国家。对于她来说，扩大范围以便包含后殖民地的社 
会革命•如墨西哥和伊朗，这将要求加入一些新变量。此外，她将面临 
的任务是将这些新变量加入她的理论中，以便使所有项共同起作用。 
得到的理论有复杂性•这种复杂性将不会产生那个使斯考切波出名的 
相对高雅的结论。因此，3斯考切波的确尝试解释后殖比国家的社会 
革命时，她提出了一个独立的理论 (Goodwin and SkocpoL 1989)。 

16.3.2 更好的拟合 

在定量研究中，分析的目标通常是估计所研究的个体变量的效应。 
就此而言，一般要施加范围条件来处理与因果异质性有关的问题。但 
是在定性研究中，目标是拥有能够达到与数据高度拟合的因果模咽•范 
围条件常常与此目标有关。研究者引入范围限定的目的是提高模型的 
整体拟合度 a 

表 1( U 用一种简单的方式展示了这种对提高拟合度的关注（关于 
这种观点的拓展分析，参见 Ragin and Schneider , 2010)。在这个表 
中，我们看到两个二分变量之间的关 系：高 的人均 （ ; DP (自变量）和民 
主（因变 M )。 从集合论的视角看，拟合度总体而言相当好 ：高的 (；DP 
对于民主来说儿乎是充分的。然而，有8个个案有高的人均 GDP 却没 
有民主，因此违反了集合论关系。理想情况下，定性研究者希望有0个 
反例，即低权力的单元应该为空。 

有一种提高拟合度的方式，即探索这些“问题”个案是否存在一些 
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可作为范围条件的基础的共同之处。如果是这样，就可以将它们从分 
析中消除，留下较强的、更清晰的结果（即一个完美的充分条件关系）。 
结果表明，这些问题个案（除了新加坡)都严重依赖于石油，例如，波斯 
湾地区的石油国家。因此，如果研究者引入的范围限定排除了所有的 
高度依赖石油的国家，就会显著地提高模型的集合论拟合度。 

表 16.1 宽范围 ：人均 GDP 和民主 


民主 

0 


高的人均 GDP 


0 1 


55 

37 

44 

8 


f = 9.5， /) = 0.002, N = 144 
1995年 


资料来源： Gerring ， 2007。 

研究者也许倾向于相信，这种范围限定只不过是消除一些(依据某 
种模型所界定的)奇异值罢了。然而，范围限定是一个抽象的变量（例 
如高度依赖石油），而不简单是一系列具体的国家（如沙特阿拉伯、也 
门）。此外，在检验高度人均 GDP 对民主的影响时，可能有好的理论理 
由来说明为什么要去掉高度依赖石油的国家。如果研究者相信，高度 
人均 GDP 是诸如“经济发展”这样的宽口径概念的衡量指标，那么，加 
入这些个案就会增加对测量误差的关注，即石油依赖型经济也许有高 
度人均 GDP 却没有真正的经济发展。 

另外一个方式是证明石油依赖型国家与几乎所有其他国家都不 
同，因为其税收不依靠向公民征税。如果有人认为，高度 GDP 通过什 
么机制导致民主，这与社会中的国家基础权力及展现有关，那么就有很 
好的理由排除这些个案，因为它们没有显示所提出的机制。 

为了进一步探索这个想法，我们收集了 1995年的石油出口数据， 
并去掉了所有高度依赖石油的国家。得到的全体个案产生了表16.2。 
即使新加坡仍然出现在右下角单元格中，关于充分关系的集合论发现 
还是相当明显的。从定性研究的立场看，可以将它看成是一种受理论 
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驱动的范围限定，这种范围限定以一种在方法论上适当的方式来处理 
问题个案。在权衡方面，我们以相对次要和理论 t 站得住脚的范围变 
化为代价，得到了一个近乎完美的充分关系。 

表 16 . 2 窄范围 ：人均 GDP 和民主 


民主 

0 

X — 19 . \y p = 0.000 1 ， N = 130 

1995年 

当我们已经聚焦在充分条件单元格时•一种范围条件的应用会潜 
在地从所有箏元格中移除 个案， 注意到这一点很 f : 要。在本例屮•范围 
条件从所有4个单元格中移除了共14个个案。从集合论的立场看•这 
不是一个大问题，因为右上角的单元仍被很好地占据着。如果范围条 
件移除了右上角单元的所有（或儿乎所有）个案，关系将仍然是一种接 
近充分性的关系，但它会变得微不足道 ( Goertz ， 2006； Ragin , 2008)。 

从定量的角度讲，研究 者也可 以就表 16.1 追问范围限定的使用问 
题。如果范围条件运行良好的话，会发生两件 事情： N 下降•拟合度上 
升。由于 ATF 降，显著性水平会受影响.但是希望拟合度的上升能充 
分补偿那种损失。在本例中发生的是 :我们 获得一个更有实质意义的、 
更具有 统计显 著性的 X 2 。通过比较表] 6.1 和表 16.2 可以看到这个结 
果。 N 下降了 14,而 P 从 9.5 t 升到16.2,并目.显著性水平也提高了 
不少。 

更大的问题仍然 存在: 值得这么做吗？在大样本统计分析中•答案 
往往是否定的。 X 2 的增加固然好。 ® 然而，其代价却是概括范围的降低 
和(看起来不那么容易）获得 ffl 关数据所耗的时间。研究者将不得不辩 
解为什么使川范围条件而不是一个模型内的解。施加的范_限定能否 


人均 （;1 )P 
0 1 


54 

35 

40 

1 
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抵住模型拟合度方面的收益，这取决于在表述这种辩解时的难易程度。 

相比之下，在定性研究中，通过范围限定可以消除少量问题个案， 
从中获得的收益往往超过了普遍性上的损失。当与定量研究者相比 
时，定性学者寻求更强的概括性（即理想条件下没有例外）。这种传承 
的目的是发现强的集合论关系，该目的时常表明减少一个总体的范围， 
使之仅包括少量个案是正当的。 


16.4 范围和经验检验 

有时候，学者会明确地论证，他们的理论适用于所探究现象的所有 
情况。例如，在国际关系冲突的文献中，我们看到一些名家认为他们的 
理论几乎适用于所有地方。 


大多数理性选择理论家（包括结构实在论者）都不声称他们的 
理论应该受限于时空，因此期望在政治上的相关两方组 （ dyads) 或 
者其他子集合中发现的关系也在所有的两方组中成立。事实上， 
在形式的理性选择理论家中间，布埃 诺 • 麦斯奎塔（ Bueno de 
Mesquita, 1981 ) 明确地指出，关于战争的期望效用理论应该适合 
于所有的地区和时期。肯尼思 • 华尔兹 （Kenneth Waltz) 在一部 
数学表述较少的著作中类似地指出，（与国内事务因素相反）系统 
结构的限制和诱导随时间推移对所有国家都有相同的影响。 
(Bennett and Stam, 2000:555) 

虽然一些学者在理论层次上暗含一个普遍的适用范围，但是在理 
论的提议范围 （proposed scope) 和经验范围 （empirical scope) 之间会有 

脱节。经验范围指的是由经验检验和探究所确立的一个模型的范围。 
在社会科学中，范围限定通常产生于经验上的点播.这样可以考量理论 
在哪里适用，在哪里不适用。这种做法无可 厚非; 事实上，它在自然科 
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学很常见，也是科学研究的关键部分。在增长性的研究纲领中.在经验 
发现与范围精炼（以及理论的其他方面）之间常有一种自然的来回摆 
动。研究者在建构与他们的理论相关的整个总体时需要一个过程，而 
经验结果和发现对于该过程来说是关键 ( Ragin ， 2000)。 

遗憾的是，在理论的提议范围和理论的经验效度之间经常有逆关 
系。概括地说，我们认为，与范围比较受限的理论相比，范围较广的理 
论更容易在经验上是错误的（或者不能被强检验所确证）。因此，学者 
面临着范围和经验效度之间的基础权衡 （Przeworski and Teune ， 
1970)。虽然他们试图阐述具有高度普遍性的理论，但是他们经常必须 
牺牲普遍性以获得有效的解释。 

在定 M 传统中，当讨论统计模型中大量使用的控制变量的时候•更 
大的普遍性和经验效度之间会岀现张力。尽管使用控制变量是一个模 
型内的解，它帮助学者避免限定他们的理论范围，不过近期的文章提出 
了这样的问题，即加入多个控制变量时，研究者可以在多大程度上获得 
有效的解释。例如，阿肯建议，在一个统计模型中应该包含的自变量大 
约只有 三个： 

三个自变量准则 （A Rule of Three ， ART ) :包 含的解释变量 
超过三个的统计设定是没有意义的。 ART 听起来很苛刻，但是事 
实上，它只是可靠的智识罢了。自变量数超过三个时，就没有人能 
进行审慎的数据分析以确保模型设定是准确的，同时确保诸多假 
定如研究者所宣称的那样拟合的好。 ( Achen , 2002： 446) 

如果研究者认真对待这个建议，那么范围限定就成为一项有吸引 
力的选择。虽然范围限定约束了普遍性•但是它们却允许研究者运行 
一 个包含较少控制变量的统计模型。不足为奇的是，阿肯倡导在小范 
围内进行更集中和高质量的分析： 
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依然更加重要的是，大的、模糊的线性回归和慨率单位方程 
(prohit equations ) 似乎需要很多控制变量•恰恰是因为它 们将不 
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在一起的各类观测项塞在一起。国家、战争、种族类别、宗教偏好、 
教育水平和其他可以改变人们的系数的变量用虚拟变量来“控 
制”，这些虚拟变量完全不足以建构它们的效应模型。结果是一长 
串自变量清单 、一 袋子乱七八糟几乎无关的观测项，以及通常带有 
无意义（但在统计上是有几个星号显著的）结果的无希望的糟糕设 
定……反而，专业的研究习惯需要更强调在定量社会科学中产生 
的众多经典技 巧：图 、列联表以及只简单考察数据。这些方法很简 
单，不过它们是精致地简单。在我们正使用的精致统计工具中有 
诸多假定，这些技巧往往揭露了这些假定是失败的，因此挽救了我 
们的推理错误。做这样的工作是缓慢的，它要求我们限定在有少 
量解释因素的情形——通常不超过三个。将我们限定在数据子集 
(其中的假定是合理的）的同时也使我们限定在仅需要有少数解释 
因素的个案了，因此，我们可以进行创造性地思考，这是科学的精 
髓所在。因此，限定在同质的数据子集（及其概率单位和 logit 的 
对等项）的小型回归设定远远不是一个限制，而恰恰是我们进步的 
最佳机会所在。 （ Achen ， 2005：337, 338) 

这种论点与定性学者是相投的。在使用涵盖广泛时空领域的研究 
设计时，定性研究者犹豫不决，这种状态十分符合上述论点。 

在统计传承中，匹配方法虽然在此背景下不被经常提及，但其运用 
涉及降低经验范围，以便进行更好的经验检验。当使用匹配方法的时 
候，定量学者会放弃一些个案，更关注其他个案。因数据性质的不同， 
可能要放弃相当大比例的个案，因为它们不匹配。包含在匹配中的个 
案并不是总体屮所有个案的随机子集。其结果是，通过匹配生成的结 
果的经验范围比在总数据集合中执行标准统计分析的范围要小。 

实验法的使用也经常涉及限定普遍性来执行强的经验检验。这种 
权衡可以通过内部效度与外部效度的语言来讨论。对于实际研究的被 
试总体来说，虽然设计合理的实验可以达到高水平的内部效度，但是在 
将这些实验结果向更广的情境推广时，研究者经常感到有难度。实验 
结果的外部效度通常是一个真问题 (Morton and Williams ， 2010)。虽 
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然这些问题未必无法克服，但它们往往向实验结果的普遍性提出了 
挑战。 

当然，在定性传统中也一直存在同样的问题和挑战。例如，个案研 
究者面临一个完全标准的问题，即研究结果的普遍性何在。虽然对于 
一个个案的解释可能有说服力，但是学术界想要知道它的适用面是否 
更广。在此意义上，个案研究者和实验者必须经常处理相似的外部效 
度问题。 


16.5 结论 

范围问题引发了社会科学研究中的基础权衡。一种权衡关注普遍 
性和简约性之间的张力。学者在提升普遍性的尝试中，可能扩大他们 
理论的范围。然而，扩大范围通常需要使因果模型复杂化，从而使理论 
的简约性降低。牺牲简约性以获得更大的适用范围，这种做法是否合 
理，取决于要求的复杂性程度以及范围的扩展程度。在定性传统中，扩 
展范围通常是不合理的，因为即使适度的扩展也经常要对因果模型进 
行复杂的修正。相比之下，在定量传承中，扩展范围更经常是合理的， 
因为分析者有时可以通过对因果模型进行适度的调整而适应许多新的 
个案。 

另一种权衡关注两个方面的张力，一方面是普遍性，另一方面是模 
型的拟合问题。范围限定如果在模型拟合或经验效度上取得了大收 
益，它通常就是合理的。在定性研究中，分析者少有例外，都寻求高度 
概括，范围限定可以显著提高模型对数据的拟合度，尤其是当限定可以 
在理论基础上得到明确辩护的时候更是如此。传统上讲，定量学者已 
经不愿意降低他们的论证范围以获得更好的数据拟合。然而，近年来， 
一些定量方法论者更多鼓励使用范围限定。在定量研究中，牺牲普遍 
性以进行更“强”的检验并提高效度，这可能是一个新趋势。 
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结论 


差异性恰恰和相似性一样，可以成为相互吸引的原因 . . 

定类型的差异使我们倾向于接近他人。这意味着相互补充，而非 
反对和排斥。 

-埃米尔 • 涂尔干 （6 mile Durkheim ) 

金、基欧汉和维巴在《社会科学中的研究设计》一书中给出如下总 
结性文字 :“定 性研究者所面临的方法论问题也是所有科学研究者需要 
面对的。只有内在逻辑得到充分的理解和遵循后，所有的社会科学研 
究才能做岀有效的推论。” (King，Keohane and Verba, 1994:230)。 相 

比之下，在本书行将杀青之际，我们希望再次提清注意定性研究和定量 
研究在性质上的重要差别——这些差别涉及研究设计、数据分析、概念 
和因果推断。在陈词滥调的相似性(例如，研究目的是通过使用系统的 
程序进行有效的推断)之外，没有一套原则可以将所有的社会科学研究 
统一起来。 

然而，我们确信，在定量和定性研究范式之间存在着对话的空 
间。虽然两种研究范式的差异很大，但是在一项旨在解释社会和政 
治世界的总项目中，二者恰好可以互补。就像涂尔干关于有机团结 
的洞见一样，我们在定量和定性研究之间看到了富有成效的合作的 
现实可能性，这种可能性建立在相互尊重与欣赏之上。然而，为了实 
现这种可能性，需要我们正面理解和承认在两种研究传统之间存在 
的许多重要差异。 
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表 17.1 汇总的对比1:个案 

描述项 

定量传统 

定性传统 所在章 

(1) 解释个案中的结果 

很 少 

常 见 1， 

3, 4, 6 

(2) 跨个案对个案内 

个案间为要 

个案内为主 1 

1, 4, 8 

(3) 因果机制 

可 选 

必须被定义 7 

, 8, 14 

(4) 过程追踪法 

可 选 

标准的 7, 8, 14 

(5) 反事实分析 

主要是个案间 

主要是个案内 

9 

表 17.2 

汇总的对比 n : 因果性和因果模型 


描述项 

定量传统 

定性传统 

所在草 

(1) 关注个体变量 

标准 

有时 2 

, 6. 8, 9 

(2) 因果构型.交互项 

有时 

常见 2, 4, 6, 8 

(3) 因果效应 

平均处理效应 

必要的和/或 ? 

充分的 

3, 4, 6, 8 

(4) 反事实的目的 

阐释模塑和参数 
估计 

个案内的因 
果推断 

9 

(5) 殊途同归 

内隐的，模型是 
路径 

明确的 

2, 4 

(6) 因果模型中的聚介 

加法、对数线性、 
连接函数中可加 

极大值、极小值、 

充分非必要条件 
的必要非允分部 
分 （ INUS ) 

2, 4 


17.1 差异概要 


表 17.1 至表 17.5 汇总了本书考察的两种传统之间的关键差异 。 ( D 
这些表无意呈现所苻的差异，只呈现两种传统在广度和深度上的某些 


①晖次屮明•我们的观点仅适) H 于集中笑注因采推断的研究，因此我们的汇总不 ti 
括大多数 i 全释性分析。耍想比 较诠释 学传统和我们描述的这种研究.就需要一 t 完令不 
同的清单。 
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17 结论 


对比。每个表都有五项，共得到包括 25 种差异的清单。在一些情况 

下，这两种实践的差异十分巨大，而在其他情况下则小得多•但是我们 

觉得在每一个情况下差异都是明显的。 



表 17.3 

汇总的对比 111: 总体和数据 


描述项 


定量传统 

定性传统 

所在章 

(1) 范围 


宽 

窄 

6 

(2) 选杼个案研究 


代表性、随机 （1 

, 1) 单元格最重要 

14 

(3) 选择因变量 


不 选 

有时选 

14 

(4) 数据格式(如数据表） 

行是个体观测值 

行是变 1 A 的构型 

2 

(5) 三角数据 


异方差性 

必要或充分条件 

2 

表 17.4 

汇总的对比 IV : 概念与测量 


描述项 


定量传统 

定性传统 

所在章 

(1) 术语 

变量-指标 

概念 _ 数据 

10 

(2) 本体论 

未观测的变址引起 
指标 

定义概念的诸维度 

10 

(3) 变异 

所有的变片都 心优先 
重要性 

区域中的数据变异 
不改变意义 

11 

(1) 变量转换的逻辑 

偏态性、统汁模型中 
更拟合 

语义学和意义转换 

11, 12 

(5) 类型学 

互斥 

重叠或互斥 

13 

表 17.5 汇总的对比 V : 不对称性 

描述项 


定量传统 

定性传统 

所在章 

(1) 解释0不同于解释1 

不 

有时 

5, 13 

(2) 概念及其对立而 


针对概念及其对立 
面使用 M —个概念 

. 经常使用不同的 
:概念和测量 

5, J 3 

(3) 反事实 

不同于反事实 


内含相同 

通常不同 

9 

(4) 2 X 2 表.互换 （0. 
和（1， 0) 单元 

1) 

几乎所有的相关测 
度都等值 

不同，因为一个 

1是必要条件单 
元，另一个是充 
分条件单元 

2, 5, 

15 
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使用这些表的一种方式是将其作为对研究（包括研究者自己的研 
究)进行分类的一套“身份”检验表。如果我们关于两种传承的论证可 
以很好地描述研究实践，那么单个研究计划应该趋于归入两种传承的 
一种或另一种所提出的项目中，混合的反应相对较少。在混合方法研 
究中，也可能区分出哪些是定量部分，哪些是定性部分。 

17.1.1 个案 

我们的核心论点是断言定量和定性研究者以相当不同的方式来处 
理个案。在定量研究中，分析者很少解释为什么特定的个案有特殊的 
结果。相反，这些研究者聚焦于跨个案分析以及作为一个整体的更大 
总体的特征。在一项优秀的定量研究中，学者无须开展任何过程追踪 
或者识别因果机制就可以达致主要的研究目标。如果实施反事实分 
析，它也源自跨个案比较。 

在定性研究中，分析者有一种相当普遍的做法，即努力解释为什么 
特殊的结果发生在特定的个案中。在这种探究模式中，学者在推断时 
大大依赖于个案内分析，时常也中等程度依赖于跨个案分析。于是，他 
们几乎总是使用过程追踪法，并且在所研究的特定个案中锁定背后的 
机制。他们也执行反事实分析，从中可以再现一个或多个特殊个案的 
历史。 


17.1.2 因果性和因果模型 

关于因果性和因果模型，定量研究者通常典型性地聚焦于个体变 
量的影响，以及仅在需要时加入交互项。他们依据平均处理效应来理 
解并定义因果关系。有时候，他们出于阐释其统计模型的目的而使用 
反事实，但是反事实并不被用做一种假设检验的方法。在典型的定量 
模型中，聚合的形式包含加法，或者至少在连接函数中是可加的。定量 
研究者通常不谈论殊途同归性，而是将他们的因果模型当成是代表了 
通向因变量的路径。 
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定性研究者通常更关注因果构型而不是个体变量的效应（除了必 
要条件以外）。他们根据必要条件、充分条件和“充分非必要条件的必 
要非充分部分 ”(INUS conditions ) 来理解并定义因果关系。他们经常 
使用个案反事实作为假设检验的一个途径。他们的因果模型普遍有这 
样的假定，即个案可以遵循不同的途径达到同一结果，但是这样的途径 
并不多。定性模型通过潜在地使用布尔运算（如取最大值或最小值）， 
倾向于将诸多原因项组合起来。 

17.1.3 总体和数据 

定量研究者倾向于研究大总体，并提出涵盖广泛范围的概括。当 
他们选择个案研究时，会尽量选择能代表更大总体的个案。在这种传 
统中通常有一个不好的主意，即基于因变量的值来选择个案。定量学 
者将数据汇集到标准的矩形数据表中，行表示单个观测值，列表示变 
量。当定量分析者面对一个三角数据集时，因异方差性而修正它就理 
所当然了。 

相比之下，定性研究者倾向于研究少量个案，并在小范围内概括。 
他们对感兴趣的结果和原因都存在于其中的个案特别关注。有时，他 
们选择个案恰恰是因为它们在因变量上的取值。在定性传统中，将数 
据集合的行理解为是变量值的逻辑配置 （logical configurations )。 当 
接受过定性比较分析 ( QCA ) 训练的学者在检查三角数据时，他们自然 
会把它解释为代表了必要条件或充分条件。 

17.1.4 概念和测量 

在定量传统中，测量问题一般用变量和指标术语来讨论。这里通 
常有一个假定，即潜变量引起它的指标，因此后者与前者相关联。在这 
种传统中，人们对研究和解释变量的整个变异域很感兴趣。通常因充 
分的统计理由（如修正偏态）而执行变量转换。当利用类型学的时候， 
它们指的是互斥的类别。 
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在定性传统中，解决测量问题通常需要探索概念和数据之间的关 
系。测量是一个语义学问题，它需要设定概念的界定性维度。定性学 
者经常假定,一个变量的特定领域的变异（尤其是变量的下限和上限 
值)可能与一个概念的测量不相关。定性学者很警惕变量转换，除非它 
们维持或增加了所探究的概念的含义。当运用类型学时，它们可能是 
互斥的，或者允许在多个类别中有重叠的成员资格。 

17.1.5 不对称性 

定量学者提出了对称的因果论证，其中用同样的变量和模型来解 
释一个结果是否出现。这些学者也对称地看待一个概念及其对立面， 
从而使得否概念(例如，不发展)等同于对立概念(例如，不发达）。他们 
同样潜在地假定有一个对称的反事实观，其中一个方向的变化(例如， 
从威权主义到民主）貌似是另一*种方向的变化。最后，大多数 2 X 2 表 
的统计测度都是对称的。 

相比之下，定性学者经常提出不对称的因果论证，其中用不同的变 
量和模型来解释一个结果是否出现。他们经常假定一个概念及其对立 
面是不对 称的; 它们可能需要有不同的定义和测度。他们同样坚持不 
对称的反事实观，其中一个方向的变化不见得像另一个方向的变化。 
最后，在定性传统中，考察2 X 2表是因为其拥有不对称性,尤其是其必 
要条件和充分条件有典型的模式。 


17.2 社会科学中的方法论多元主义 

定量和定性范式之间存在的差异未必是社会科学中矛盾的来源。 
在我们列举的差异中，没有任何一种意味着矛盾。事实上，一旦人们考 
虑到研究范式之间对比性的目标和目的，这些差异就相当易懂。从各 
自的目标和目的出发，两种传承都是“可以理解的”。 
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既然两种传承都是相对一致的系统•很多研究者强烈地倾向于一 
种(而不是另一种)传承也就不足为奇了。幸运的是，合作和互相尊重 
不要求所有学者同时成为两种传承的正式成员。没有理由反对劳动分 
工的存在，其中一些学者运用装备精良的方法和工具从事专业任务。 

然而，两种传承都是有渗透性的、边界松散的系统，它们相互影响， 
这也是实情。定量和定性分析不能也不需要在相 S 隔离中追求各自的 
研究。不如说，一种传统中的方法和发现可以通过许多途径以有益的 
方式进入另一种传统中。而且，我们确信，混合方法研究常常是一个可 
行的选项。 

研究者在多大程度上可以混合两种传承，其方式多种多样。在一 
些个案中•研究者也许主要是定量的，或者定性的，但是从另一种传统 
中借鉴丫优秀的观点和工具。就像我们强调过的那样，通过理解另一 
种传承中的学者怎样做研究，我们可以学到的东西太多了。并且对于 
一位特定的学者来说，在没有完全接受另一种传承的情况下，当然可能 
在自己的研究中引入一定的实践和程序。 

对于比较彻底的混合方法研究学者来说，他们甚至也促成同时并 
且全面地追求定量和定性研究两方面特征的目标。在这里，研究者将 
估汁特定的变量在大总体中的效应，在该总体内解释特殊个案的特定 
结果。为了达到前一个目标，他或她会使用跨个案分析、统计模型和定 
量范式的工具。为了达到后一个目标，他或她会追求个案内分析，提出 
构型式的因果模型 （configurational causal models ) ，利用定性范式中的 

全部资源。因此，最终成果会包含两种相当不同但无矛盾的结果集合。 

如果赞同一定的劳动分工和将两种传承混合的可能性，我们就拥 
有了社会科学的多元视野。如此看来，应该将一处重要且受尊重的空 
间留给定量研究、定性研究和各种混合方法研究。我们相信，如果说在 
这种方法论多元主义勃兴之途上仍有障碍的话，那么主要的障碍仅仅 
是不能清晰地辨别定量和定性分析在目标和程序上的差异，尽管二者 
同样正当。本书将这两种范式看做备选的传承，在阐明这些差异的同 
时，也培养两者之间的建设性对话。 
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附录 


政治科学和社会学中的一些重要论文都践行了诸多方法论实践， 
本附录呈现了针对这些实践的调查结果。这项调查追踪了学者在生产 
经验研究时实际做了什么，这些研究被相关学科认定是优秀的作品，在 
重要期刊上发表。至于在这一工作中典型地使用的实践是否代表“最 
佳实践”，虽然我们可以就此进行争辩，但是它们就是这样一些程序，学 
者用这些程序在各个学科内生产出最佳的实质性成果。 

对发表在政治科学和社会学顶级期刊上的论文进行分层随机抽 
样，得到的结果如下面各个表所示。样本框是2001年至2010年发表 
在六本权威期刊——《美国社会学杂志》、《美国政治科学评论》、《美国 
社会学评论》、《比较政治学》、《国际组织》、《世界政治》——上的文章。 
样本依据期刊和时间段 （2001— 2005年和2006—2010年）进行了分 
层。每一层选出40篇论文，其中有18篇被编码，导出总共216篇论 
文。样本中去掉了评论性文章和非经验性的理论文章。西北大学的两 
名博士候选人凯伦尼莎 • 莫罕达莉和克里斯托夫 • 纽伦完成了编码工 
作。带有全部数据的电子表可供读者索取。 

表 A .1 提供了我们的文章样本的基本统计量。可以看岀，定量方 
法论构成了绝对多数(72%对31%)。这里重点要记住的是，有两本期 
刊——即《美国政治科学评论》和《美国社会学评论》——很少发表定性 
研究成果。其他四本期刊发表了相当比例的定性研究文章。 

数据表明，这些期刊几乎不发表明显的多元方法研究成果。如何 
满足期刊文章长度的限制，这是开展多元方法研究遇到的一个挑战。 
然而，在一些子领域和期刊，比如《国际组织 》 (International Organiza - 
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//oW 中，我们观测到这样一种传统，即在发表的定量论文中包含几个 

短小的个案研究。而且，近期关于比较政治学和国际关系学的著作都 

明确地转向了多元方法研究。 

表 AJ 使用的方法论 

方法论 

百分比（％) 

定量研究 

72 

定性研究 

31 

明确的多元方法 

1 

诠释性研究 

2 

理论的/博弈论 

8 

注:论 文可使用不止一种方法论。 


表12使用的定性方法论 

方法论 

百分比（％) 

个案研究(/V = 1) 

27 

小样本研究 （1 < N < 10) 

63 

中样本研究 (A/ > 9) 

8 

类型学 

26 

定性比较研究 (QCA) 

1 

殊途同归性 

13 

反事实 

15 

新概念 

31 

明确的过程追踪 

22 

自变量的中位数 

2 


注:论 文可使用不止一种方法论。 


在我们调查的论文中使用了各种定性方法论，表 A.2 提供了关于 
这些方法论的基本信息。超过90%的定性论文都是个案研究或小样 
本研究，这并不奇怪。其中，小样本研究比个案研究更多一些。数据还 
显示，中样本研究不 常见; 只有8%的定性论文有10个或更多个个案。 

定性研究的一个很常见的部分是使用类型学，在所有论文中，大约 
有1/4包含有明确的类型学。由于定性学者不受限于需要大量个案的 
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数据，因此，无论出于描述性目的还是解释性目的，他们都能更容易提 
岀类型学。这些类型学通常要引入新概念，这在定性研究中不是不常 
见(在全部定性论文中，有 31% 引人了一个新概念）。 

明确地讨论反事实和殊途同归性的论文比例比较低（分别是15% 
和 13%)。 正如我们已经讨论过的，在定性研究中，反事实的使用常常 
是隐性的，而且不直接作为一种推断方法来讨论。反过来，这与大多数 
定性研究者在使用方法论工具上的非系统性有关，同样，在一项分析中 
殊途同归性也常常是隐含的，尽管它的有限使用更有可能与大多数定 
性研究的小样本有关。个案研究几乎从定义上就决定了它只能考虑一 
种路径。当有一个或多个个案时，殊途同归性就真的开始起作用了。 

尽管在定性研究中常常暗中使用过程追踪法，该方法通常也不直 
接使用。在我们的样本中，只有22%的文章明确地使用了过程追 
踪法。 

定性方法论领域的一个重大挑战是鼓励学者更多地意识到方法论 
问题，以及更明确地了解他们用以推断的程序。我们希望本书帮助定 
性研究者提升更大的方法论自觉。 


表 A .3 使用的定量方法论 


方法论 

百分比（％) 

最小二乘法 ( OLS ) 

23 

Logit / 概率单位 [ n | 归 （ Logit / probil ) 

37 

时间序列 

2 

面板/时间序列截面 ( Panel / TSC \ S ) 

18 

交互项 

18 

讨论 R 2 

6 

贝叶斯方法 

3 

实验法 

5 

工具变量 

3 


注: 论文可使用不止一种方法。 


现在转向定量研究。表 A .3 表明，在政治科学和社会学中，主流、经 
典和统计的子传承仍占主导。如果我们统合常规最小二乘法 （ OLS )、 
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logit 回归 （logit regression )、时间序列分析和面板方法论，就会囊括所 
有定量论文的80%。®尽管贝叶斯技术很少出现在我们的调查中，但是 
该技术的使用正在上升，它可能是我们考察过的期刊中的一篇作品。同 
样，尽管潜在结果架构 （potential outcomes framework ) 乂名 Ney 

man - Rubin - Holland 模型-在方法论文章中非常有影响力，但是在 

我们凋查的216篇文章中，没有一篇可觅其踪迹。另一方面， nj ■以将工 
具变量和实验法的使用看成是潜在结果架构的指标，它们合汁占到所 
有文章的8%。 

各种传承总是混含着久存的实践和速变的实践。定性传承、定 M 
传承和它们的子传承都无例外。我们的调查反映了过去十年的研究， 
但是，如果查看一个长时段，很多编码的项目得分就会发生重要变化， 
而且更重要的是，一些项目会加入•另一些项目会被清除。除了随时间 
而变，传承也随空间——可能是子领域、学科或者地理范围——而变。 
在比较研究和国际关系研究中，多元方法分析看起来越来越常见并享 
有声望•但是在关于美国政治的研究工作中远非如此。定性比较分析 
( QCA ) 在社会学中比在政治科学中得到了更多的关注和尊重。如果 
在欧洲和美国之间比较其身份地位也是如此。 

最后，本书在特定的时空提供 r 方法论实践的一*个快照。两种传 
承之争特別适合于描绘21世纪初的美国情形。两种传承之间的差异 
十分显著，以至于很可能持续到未来。不过，我们也认为，一个成长中 
的学者群体将跨越边界开展研究，创造性地将来自两种传承的观点组 
合起来。这种交叉的研究关注的是如何超越分歧•这可能很好地代表 
了未来数年最令人兴奋的社会科学。 


①一篇文葶可能使用多种方法论，但这些种类很少茧叠 a 
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术语对照表 


aggregation techniques 聚合技术 
asymmetry 非对称性 
average treatment effect 平均处理 
效应 

Bayesian inference 贝叶斯推断 
Boolean methods 布尔代数法 
cases 个案 

causal complexity 因果复杂性 
causal inference 因果推断 
causal mechanism 因果机制 
causal models 因果模型 
causal-process observation ( CPO ) 

因果过程观测 

causes-of-effects approach 先果后 
因研究 

concepts 概念 

conjunctural causation 结合因果性 
constant conjunction definition of 
causation 因果性的恒随定义 
counterfactual analysis 反事实分析 
covering laws 覆盖律 
critical theory 批判理论 
culture 传承 

data-set observations (DS( )s) 数据 
集观测项 

effects-of-causes approach 先因后 
果研究 


error 误差 
experiments 实验 
Fundamental Principle of Variable 
Transformation 变量转换的基本 
原则 

Fundamental Problem of Causal In¬ 
ference 因果推断基础问题 
Fundamental Tradeoffs 基本权衡 
fuzzy-set analysis 模糊集分析 
game theory 博弈论 
generalization 概括 
heteroskedast icity 异方差性 
individual case analysis 个体个案 

分析 

Institute for Qualitative and Multi- 
Method Research (IQMR) 定性 

与多元方法研究所 
interaction terms 交互项 
interpretive methods i 全释法 
Intcruniversity Consortium for Political 
and Scxrial Research (ICI°SR) 政治 

与社会研究校际联盟 
INUS condition 充分非必要条件的 
必要非充分部分 
Logic 逻辑学 
logical AND 逻辑“与” 
logical OR 逻辑“或” 
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术语对照表 


measurement 测量 
mechanism 机制 
method of agreement 求同法 
method of difference 求异法 
mixed-met hod research 混合法研究 
multimethod research 多元方法 
研究 

multiple causation 多元因果 
necessary condition 必要条件 
Neyman-Rul)in-Holland model Ney- 
man- Rubin- Holland 模型 
overdetermination 过度决定 
Paradox of the Perfect Predictor 完 
美预测项悖论 

potential outcomes framework 潜在 

结果架构 

Principle of Conceptual Opposites 


概念对立面原理 

Principle of Conceptual Overlap 概 

念重叠原理 

Principle of Unimportant Variation 

次要变异原理 
process tracing 过程追踪 
qualitative research 定性石开究 
(luantitative research 定量研究 
Rorschach Principle 罗夏原则 
scope conditions 范围条件 
set theory 集合论 
statistical methods 统计模型 
sufficient condition 充分条件 
translation problems 转译问题 
validity 效度 

variable transformations 变量转换 
within-case analysis 个案内分析 
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译后记 


我们相信，读者在诸多学术场合会发现定量研究和定性研究的学 
各在相互贬低。某些著名的定量学者可能声称，定性研究不是科学，某 
些著名的定性研究者或许认定•统计均值研究不能把握丰富的社会 lit 
界。定量研究和定性研究到底是什么关系？加里•金等学者在《社会 
科学中的研究设计》(陈硕译，格致岀版社2014年版）中认为，这两种研 
究框架的逻辑是一样的。本书对此持反驳态度，并从研究设计、因果推 
断、数据分析、概念形成、个案选择、概括范围等方面详细地论证了二者 
之间的差异。比如，在作者看来，定 M 研究主要用统计学与概率论语 
言，定性研究却以集合论与逻辑学为基础。集合论模型处理的是不对 
称关系，假定不同的 X 值对 Y 产生不同的效应，而统计模型通常有这 
样的假定，即不管 x 的起点值怎样 . x 的单位变化都对 y 产生同样的 
影响。定性学者用个案内分析.就所研究的特定个案说明哪些因素会 
产生结果•定量学者则依据个案间分析向总体做推断。定性研究和定 
量研究使用的标准因果模型[方程 (4.1) 和方程 (4.2)] 差异很大•难以比 
较。在定性的个案内因果分析中，反事实分析居于核心， ifir 在定量研究 
中，反事实分析的目的在于解释统计估汁的结果•做出有关因果效应的 
普遍论断。在定性传统中•研究者要确定一个概念的属性，定义此概念 
的意义，对拥有极值的个案最有自信，定量研究则要通过区分出指标来 
建构概念，这些指标是由所研究的概念引起的，定量学者对有极值的个 
案最没有把握。 定量研 究者试图估计大总体内的平均效应，欢迎随机 
选择的个案•不会赋予特定的个案以特殊的权重;定性研究者则旨在解 
释特殊个案，通常对某些单元的抽样有偏好，经常关注实质重要的个 
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案。定量学者采用标准化和取对数值等进行数据转换，定性研究者几 
乎不做这样的转换.而是“校准”数据，使之符合分析者所界定的概念的 
意义。定性研究用过程追踪进行个案内分析•定量学者关注回归分析在 
产生强因果推断方面的能力，可用实验法来估计某种处理的平均效应， 
不过实验研究未必把捤住机制。在定性研究中，强概括指的是集合论的 
关系，其形式大致为:“所有/没有 A 是 ZT •而在定量研究中，强概括的意 
义是两个变量之间有强的统计相关，或者存在显著的平均处理效应。 

当然,这两种研究路数也在互补。统计研究者越来越用定性个案 
研究来补充他们的研究，时定性研究者就少 M 个案做出发现的时候•也 
关注其是否具有普遍意义，小样本的发现可能会刺激一个范围更广的 
利用大样本的跨个案检验。本书对这两种研究路数之差异的论证非常 
细致，读者必然从阅读中获益匪浅。不过耑要提醒读者注意，本书并不 
讨论 诠释性的研究，因为它不关注因果分析，而重在阐释行为的意义或 
批判权力的运用。 

本书原文书名为 A Tale of 丁 ㈣ OAwo ••无论怎样直译都未达 
其精髓.张磊博士建议译成两种传承，同时就个別语句的译法提供了高 
见。笔者曾将本书作为学生课外阅渎的专业文献•邀请哈尔滨工程大 
学社会学系2011级本科生常怡、吴娜等，2014级研究生张国锋、周莹 
等同学参与翻译本朽的初稿•西安交通大学2012级朱翠翠同学帮我检 
查中文译稿。北京大学社会学系郭志刚教授、张静教授，南京大学社会 
学院风笑人•教授，两安交通大学社会学系边燕杰教授拨冗惠赐荐语，责 
任编辑王亚丽女士为本书付岀了艰辛的劳动。在此一并致以衷心的感 
谢！渎者如能通过阅读本书.厘清定性与定量研究之差异，破除二者相 
互贬低的境况，穷实社会研究的方法论基础，译者便会在异化世界中暂 
时寻得诠释性的生命之意义，这种意义是利用本 K 的逻辑所推断不出 
来的。本朽的翻译得到国家社会科学基金项目（批准号 ：13 BSH 054) 和 
国家社会科学基金重大招标项目（批 准号： 13& ZD 177) 的支持。译文 
不当之处,请读者批评指正。 


2016年4月6日于西交大三村寓所 
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